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内 容 简 介 


全 书 共 19 章 , 主 要 内 容 如 下 :第 1 章 介绍 Python 基础 知识 与 概念 ;第 2 章 讲解 列表 元 组 .字典 、 集 合 
等 常用 序列 结构 ;第 3 章 讲解 Python 选择 结构 与 循环 结构 ;第 4 章 讲解 字符 串 基本 操作 方法 与 正则 表达 式 
模块 re 的 用 法 ;第 5 章 讲解 函数 定义 与 使 用 ;第 6 章 讲解 面向 对 象 编程 有 关 的 知识 ;第 7 章 讲解 文本 文件 
与 二 进 制 文件 的 读 写 ,以 及 文件 与 目录 操作 ;第 8 章 讲解 异常 处 理 结构 以 及 Python 程序 的 调试 与 测试 方 
法 ;第 9 章 讲 解 标准 库 tkinter 和 扩展 库 wxPython 的 GUI 应 用 ;第 10 章 讲解 网 络 编程 ,网 页 内 容 读 取 ， 
Web 应 用 开发 ;第 11 章 介绍 MapReduce 和 Hadoop 编程 ;第 12 章 讲解 注册 表 编 程 .GUI 编程 以 及 系统 运 
维 编程 ;第 13 章 讲 解 多 线程 与 多 进程 编程 ;第 14 章 介绍 SQLite, Access, MS SQL Server, MySQL 访问 方 
法 ;第 15 章 讲解 图 形 图 像 编程 .音乐 编程 以 及 语音 识别 ;第 16 章 介 绍 道 向 工程 与 软件 分 析 原 理 、 
IDAPython 编程 、Immunity Debugger 以 及 Windows 平台 软件 调试 原理 ;第 17 章 讲解 NumPy、 SciPy、 
Matplotlib, statistics 与 pandas 在 科学 计算 与 可 视 化 ,数据 处 理 ,统计 与 分 析 中 的 应 用 ;第 18 章 讲解 安全 哈 
希 算法 、 对 称 密 钥 密码 算法 DES AES 以 及 非 对 称 密 钥 密 码 算法 RSA 与 DSA; 第 19 章 讲解 安 卓 平 台 的 
Python 程序 设计 。 

本 书 对 Python 内 部 工作 原理 进行 了 一 定 深度 的 剖析 ,90%% 以 上 的 案例 均 使 用 Python 3. 5. 1 实现 ,个 
别 案例 使 用 Python 2.7.11 实现 ,并 适当 介绍 了 Python 程序 优化 和 安全 编程 的 有 关 知 识 ,可 以 满足 不 同 层 
次 读者 的 需要 。 本 书 既 可 以 作为 计算 机 及 相关 专业 学 生 的 教材 ,也 可 以 作为 Python 爱好 者 的 参考 书 。 
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《Python 程序 设计 (第 前言 | 


Python 由 Guido van Rossum 于 1989 年 底 开始 研制 ,第 一 个 公开 发 行 版 本 发 行 于 1991 
年 。Python 推出 不 久 就 迅速 得 到 了 各 行业 人 士 的 青睐 ,经 过 20 多 年 的 发 展 , Python 已 经 
渗透 到 计算 机 科学 与 技术 、 统 计 分 析 、 移 动 终端 开发 .科学 计算 可 视 化 、 道 向 工程 与 软件 分 
析 、 图 形 图 像 处 理 、 人 工 智 能 、 游 戏 设计 与 策划 、 网 站 开发 .数据 仆 取 与 大 数据 处 理 、 密 码 学 、 
系统 运 维 .音乐 编程 .计算 机 辅助 教育 、 医 药 辅助 设计 、 天 文 信息 处 理化 学 .生物 等 几乎 所 有 
专业 和 领域 。 著 名 搜索 引擎 Google 的 核心 代码 使 用 Python 实现 ,迪斯尼 公司 的 动画 制作 
与 生成 采用 Python 实现 ,大 部 分 UNIX 和 Linux 都 内 建 了 Python 环境 支持 ,豆瓣 网 使 用 
Python 作为 主体 开发 语言 进行 网 站 架构 和 有 关 应 用 的 设计 与 开发 ,网 易 大 量 网 络 游戏 的 服 
务 器 端 代 码 超过 70% 采 用 Python 进行 设计 与 开发 , 易 度 的 PaaA 企业 应 用 云端 开发 平台 
百度 云 计 算 平台 BAE 也 都 大 量 采用 了 Python 语言 ,美国 宇航 局 使 用 Python 实现 了 CAD/ 
CAE/PDM 库 及 模型 管理 系统 ,Yahoo 公司 使 用 Python 建立 全 球 范围 的 站 点 群 ,微软 公司 
的 集成 开发 环境 Visual Studio 2015 开始 默认 支持 Python 语言 而 不 需要 像 之 前 的 版 本 一 样 
再 单独 安装 PTVS 和 IronPython 插件 ,开源 ERP 系统 Odoo 完全 采用 Python 语言 开发 ， 
引力 波 数据 是 用 Python 进行 处 理 和 分 析 的 ,类 似 的 案例 数不胜数 。 

早 在 多 年 前 Python 就 已 经 成 为 卡耐基 梅 隆 大 学 、 麻 省 理工 学 院 、 加 州 大 学 伯克利 分 
校 , 喻 佛 大 学 等 国外 很 多 大 学 计算 机 专业 或 非 计算 机 专业 的 程序 设计 入 门 教学 语言 ,目前 国 
内 也 有 不 少 学 校 的 多 个 专业 陆续 开设 了 Python 程序 设计 课程 。Python 语言 连续 多 年 在 
TIOBE 网 站 的 编程 语言 排行 榜 上 排名 第 7 位 或 第 8 位 ,2011 年 1 月 被 TIOBE 网 站 评 为 
2010 年 度 语言 ;在 2014 年 12 月 份 IEEE Spectrum 推出 的 编程 语言 排行 榜 中 ,Python 取得 
了 第 5 位 的 好 名 次 ;2015 年 12 月 份 TIOBE 编程 语言 排行 榜 上 Python 跃 居 第 4 位 , 仅 次 于 
JavaC 和 C++ ,已 经 成 为 脚本 语言 的 标准 ;Top developer Languages of 2015 更 是 把 
Python 排 到 了 第 3 位 。 

Python 是 一 门 免费 .开源 的 跨 平 台 高 级 动态 编程 语言 ,支持 命令 式 编程 .函数 式 编程 ， 
完全 支持 面向 对 象 程序 设计 ,拥有 大 量 功 能 强大 的 内 置 对 象 ,标准 库 和 扩展 库 以 及 众多 狂热 
的 支持 者 ,使 得 各 领域 的 科研 人 员 、 策 划 人 员 甚 至 管理 人 员 能 够 快速 实现 和 验证 自己 的 思路 
与 创意 。 在 有 些 编程 语言 中 需要 编写 大 量 代码 才能 实现 的 功能 ,在 Python 中 直接 调用 内 
置 函 数 或 标准 库 方法 即 可 实现 。Python 用 户 只 需要 把 主要 精力 放 在 业务 逻辑 的 设计 与 实 
现 上 ,在 开发 效率 和 运行 效率 之 间 达 到 了 完美 的 平衡 ,其 精妙 之 处 令 人 赞叹 。 

Python 是 一 门 快乐 ,优雅 的 语言 。 与 C 语 言 系列 和 Java 等 语言 相 比 ,Python 大 幅度 降 
低 了 学 习 与 使 用 的 难度 。Python 易学 易 用 ,语法 简洁 清晰 ,代码 可 读 性 强 , 编 程 模式 非常 符 
合 人 类 思维 方式 和 习惯 。 经 常 浏览 Python 社区 的 优秀 代码 .Python 标准 库 和 扩展 库 文档 
其 至 源 代码 ,适当 了 解 其 内 部 工作 原理 ,可 以 帮助 读者 编写 更 加 优雅 的 Python 程序 。 

如 果 读 者 有 其 他 程序 设计 语言 的 基础 ,那么 在 学 习 和 使 用 Python 的 过 程 中 ,一 定 不 要 
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把 其 他 语言 的 编程 习惯 和 风格 带 到 Python 中 来 ,那样 不 仅 会 使 得 代码 变 得 非常 元 长 . 烦 
琐 , 还 可 能 会 严重 影响 代码 的 效率 。 应 该 尽量 尝试 从 最 自然 .最 简洁 的 角度 出 发 去 思考 和 解 
决 问题 ,这样 才 能 写 出 更 加 优雅 .更 加 Pythonic 的 代码 。 


本 书 内 容 组 织 


对 于 Python 程序 员 来 说 ,熟练 运用 优秀 .成熟 的 扩展 库 可 以 快速 实现 业务 逻辑 和 创 
意 ,而 Python 语言 基础 知识 和 基本 数据 结构 的 熟练 掌握 则 是 理解 和 运用 其 他 扩展 库 的 必 
ARE ,并 且 在 实际 开发 中 建议 优先 使 用 Python 内 置 对 象 和 标准 库 对 象 实现 预定 功能 。 
本 书 前 8 章 使 用 大 量 篇 幅 介绍 Python 编程 基础 知识 ,通过 大 量 案例 演示 Python 语言 的 精 
妙 与 强大 。 从 第 9 章 开 始 介绍 大 量 标准 库 和 扩展 库 在 GUI 编程 、 网 络 编程 ,数据库 编程 ,大 
数据 处 理 、Windows 系统 编程 、 多 线程 与 多 进程 编程 .逆向 工程 与 软件 分 析 、 图 形 图 像 编 程 、 
科学 计算 可 视 化 ,密码 学 编程 移动 终端 编程 等 多 个 领域 的 应 用 。 全 书 共 19 章 , 主 要 内 容 组 
织 如 下 。 

第 1 章 基础 知识 。 介 绍 如 何 选择 Python 版 本 ,Python 对 和 象 模型 ,数字 、 字 符 串 等 基 
本 数据 类 型 ,运算 符 与 表达 式 , 内 置 函 数 , 基 本 输入 输出 ,Python 程序 文件 名 ,扩展 库 管 理 与 
使 用 ,Python 代码 编写 规范 等 。 

第 2 章 Python 序列 。 讲 解 序列 常用 的 方法 和 基本 操作 ,成 员 测试 运算 符 , 切 片 操作 ， 
列表 基本 操作 与 常用 方法 ,列表 推导 式 , 元 组 与 生成 器 推导 式 ,序列 解 包 ,字典 、 集 合 基本 操 
作 与 常用 方法 ,字典 推导 式 与 集合 推导 式 , 以 及 如 何 使 用 列表 实现 栈 、 队 列 、 二 叉 树 有 向 图 
等 复杂 数据 结构 。 

第 3 章 选择 与 循环 。 讲 解 Python 选择 结构 for 循环 与 while 循环 , 带 else 子 句 的 循 
环 结构 ,break 与 continue 语句 ,选择 结构 与 循环 结构 的 综合 运用 。 

第 4 章 ”字符 串 与 正则 表达 式 。 讲 解 字符 串 编码 格式 ,字符 串 格式 化 替换 、 分 割 、 连 
Be 查找 、 排 版 等 基本 操作 ,正则 表达 式 语 法 、 正 则 表达 式 对 象 . 子 模式 与 match 对 象 , 以 及 
Python 正则 表达 式 模块 re 的 应 用 。 

第 5 章 函数 设计 与 使 用 。 讲 解 函数 的 定义 与 使 用 ,关键 参数 .默认 值 参数 .长度 可 变 
参数 等 不 同 参数 类 型 ,全 局 变量 与 局 部 变量 ,参数 传递 时 的 序列 解 包 ,return 语句 ,lambda 
表达 式 , 以 及 map() ,reduce() \filter()、 生 成 器 与 可 调用 对 象 等 若干 高 级 话题 。 

第 6 章 面向 对 象 程序 设计 。 讲 解 类 的 定义 与 使 用 ,self 与 cls 参数 ,类 成 员 与 实例 成 
A ,私有 成 员 与 公有 成 员 ,继承 与 派生 ,特殊 方法 与 运算 符 重 载 等 内 容 。 

第 7 章 文件 操作 。 讲 解 文件 操作 基本 知识 ,Python 文件 对 象 , 文 本 文件 读 写 操作 ,二 
进 制 文件 读 写 与 对 象 序列 化 ,文件 复制 ,移动 、 重 命名 、 文 件 类 型 检测 ,文件 完整 性 检查 .压缩 
与 解压 缩 、 文 件 夹 大 小 统计 、 文 件 夹 增 量 备 份 . 删 除 指定 类 型 的 文件 等 内 容 。 
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第 8 章 异常 处 理 结构 与 程序 调试 .测试 。 讲 解 Python 异常 类 层次 结构 与 自 定义 异常 
类 ,多 种 不 同形 式 的 异常 处 理 结构 ,使 用 IDLE 和 pdb 模块 调试 Python 程序 ,Python 单元 
测试 相关 知识 。 

第 9 章 图 形 界 面 设计 。 讲 解 如 何 使 用 Python 扩展 库 wxPython 和 标准 库 tkinter 进 
行 GUI 编程 ,主要 包括 窗 体 \、 按 钮 .文本 框 , 单 选 钮 . 复 选 框 \ 组 合 框 、 列 表 框 、 树 形 控件 以 及 
各 种 对 话 框 的 运用 ,通过 大 量 实际 案例 演示 基本 组 件 的 用 法 。 

第 10 章 ”网 络 程序 设计 。 讲 解 计算 机 网 络 基础 知识 ,TCP、UDP 编程 ,网 络 嗅 探 器 与 
端口 扫描 器 设计 ,网 页 内 容 读 取 与 网 页 疏 虫 设计 原理 ,使 用 Flask 框架 开发 Web 应 用 ,以 及 
使 用 C# 与 Python 混合 开发 Web 应 用 。 

第 11 章 大 数据 处 理 。 介 绍 大 数据 处 理 框 架 MapReduce、Hadoop 和 Spark 的 基本 概 
念 ,重点 介绍 MapReduce 和 Hadoop 应 用 。 

第 12 Ht Windows 系统 编程 。 讲 解 注 册 表 编程 .GUI 编程 .系统 版 本 判断 ,将 Python 
程序 打包 为 exe 可 执行 文件 ,在 Python 中 调用 外 部 程序 ,以 及 Python 在 系统 运 维 中 的 
应 用 。 

第 13 章 多 线程 与 多 进程 编程 。 讲 解 Python 标准 库 threading 和 multiprocessing 在 
多 线程 编程 与 多 进程 编程 中 的 应 用 ,以 及 多 线程 与 多 进程 之 间 的 数据 共享 与 同步 控制 。 

第 14 章 ”数据库 编程 。 介绍 SQLite 数据 库 及 其 相关 概念 ,Connection 对 象 、Cursor 
对 象 .Row 对 象 ,以 及 使 用 Python 扩展 库 操作 Access、MS SQL Server, MySQL 等 数据 库 。 

第 15 章 多 媒体 编程 。 讲 解 扩展 库 PyOpenGL 在 计算 机 图 形 学 编程 中 的 应 用 ,扩展 
库 PIL 与 pillow 在 图 像 编程 中 的 应 用 ,pygame 在 音乐 编程 中 的 应 用 ,以 及 speech 在 语音 识 
别 中 的 应 用 。 

第 16 章 逆向 工程 与 软件 分 析 。 介 绍 逆向 工程 与 软件 分 析 原 理 以 及 相关 插件 ， 
IDAPython 与 Immunity Debugger 在 软件 分 析 中 的 应 用 ,以 及 Windows 平台 软件 调试 
原理 。 

第 17 章 科学 计算 与 可 视 化 。 讲 解 扩 展 库 numpy、scipy、matplotlib 在 科学 计算 与 可 
视 化 领域 的 应 用 ,以 及 标准 库 statistics 与 扩展 库 pandas 在 数据 处 理 , 统 计 与 分 析 中 的 
应 用 。 

第 18 章 ”密码 学 编程 。 以 pycrypto、rsa、hashlib 等 模块 为 主讲 解 安全 哈 希 算法 、 对 称 
密 钥 密码 算法 DES 与 AES 以 及 非 对 称 密 钥 密码 算法 RSA 与 DSA 的 应 用 。 

第 19 章 ” 安 卓 平台 的 Python 编程 。 介 绍 QPython 和 QPython3 开发 环境 的 应 用 , 讲 
解 安 卓 平台 的 Python 程序 设计 。 

本 书 最 大 特点 是 信息 量 大 、 知 识 点 紧凑 .案例 丰富 、 实 用 性 强 。 全 书 200 多 个 涉及 不 同 
行业 领域 的 实用 案例 ,没有 多 余 的 文字 ,程序 输出 结果 或 软件 安装 截图 ,充分 利用 宝贵 的 篇 


ll 
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幅 来 讲解 尽 可 能 多 的 知识 ,绝对 物 超 所 值 。 本 书 作者 具有 16 年 程序 设计 教学 经 验 ,讲授 过 
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第 1 章 基础 知识 


Python 是 一 门 跨 平台 ,开源 、 免 费 的 解释 型 高 级 动态 编程 语言 ,同时 也 支持 伪 编 译 , 即 
将 Python 源 程序 转换 为 字 节 码 来 优化 程序 和 提高 运行 速度 ,并 且 支 持 使 用 py2exe 或 
pyinstaller 工具 将 Python 程序 转换 为 扩展 名 为 exe 的 可 执行 程序 ,可 以 在 没有 安装 Python 
解释 器 和 相关 依赖 包 的 Windows 平台 上 运行 ;Python 支持 命令 式 编程 .函数 式 编程 ,完全 
支持 面向 对 象 程序 设计 ,语法 简洁 清晰 ,并 且 拥 有 大 量 的 几乎 支持 所 有 领域 应 用 开发 的 成 熟 
扩展 库 ;Python 就 像 胶水 一 样 ,可 以 把 多 种 不 同 语言 编写 的 程序 融合 到 一 起 实现 无 颖 拼接， 
更 好 地 发 挥 不 同 语言 和 工具 的 优势 ,满足 不 同 应 用 领域 的 需求 。 


1.1 如 何 选择 Python 版 本 


众所周知 ,Python 官方 网 站 目前 同时 发 行 Python 2. x 和 Python 3. x 两 个 不 同系 列 的 
版 本 ,并 且 互 相 之 间 不 兼容 ,除了 输入 输出 方式 有 所 不 同 , 很 多 内 置 函 数 的 实现 和 使 用 方式 
也 有 较 大 的 区 别 , Python 3. x 对 Python 2. x 的 标准 库 也 进行 了 一 定 程度 的 重新 拆 分 和 整 
合 。 本 书 编写 完成 时 最 新 版 本 分 别 为 Python 2.7.11 和 Python 3. 5. 1。 对 于 很 多 初级 用 户 
而 言 , 最 纠结 的 一 个 问题 很 可 能 是 自己 到 底 应 该 选择 哪个 版 本 ,是 选择 Python 2. x 还 是 
Python 3. x, 是 选择 Python 2.7.x 还 是 Python 2.6.x 呢 ? 对 于 Python 的 版 本 演化 历史 ， 
这 里 不 多 解释 ,需要 说 明 的 是 ,并 不 是 数字 越 大 表示 版 本 越 新 ,例如 Python 2.7.9 就 比 
Python 3. 2. 6 晚 几 个 月 发 行 , 并 且 Python 3.2.6 比 Python 3.4.1 也 晚 几 个 月 ,类 似 的 情况 
还 有 很 多 。 另 外 ,虽然 同系 列 版 本 中 高 版 本 比 低 版 本 更 加 完善 和 成 熟 , 但 这 并 不 意味 着 最 新 
的 才 是 最 合适 的 。 很 多 扩展 库 的 发 行 总 是 滞后 于 Python 发 行 的 版 本 ,甚至 目前 还 有 很 多 
扩展 库 不 支持 Python 3. x。 因 此 ,在 选择 Python 的 时 候 ,一 定 要 先 考虑 清楚 自己 学 习 
Python 的 目的 是 什么 ,打算 做 哪 方 面 的 开发 ,有 哪些 扩展 库 可 用 ,这 些 扩展 库 最 高 支持 哪个 
版 本 的 Python。 这 些 问 题 全 部 确定 以 后 ,再 做 出 自己 的 选择 ,这样 才 能 事半功倍 ,而 不 至 于 
把 太 多 时 间 浪 费 在 Python 以 及 各 种 扩展 库 的 反复 安装 和 外 载 上 。 当 较 新 的 Python 版 本 
推出 之 后 ,不 要 急于 更 新 和 替换 已 安装 版 本 ,而 是 应 该 在 确定 自己 必须 使 用 的 扩展 库 也 推出 
了 较 新 版 本 之 后 再 一 起 进行 更 新 。 

尽管 如 此 ,以 目前 来 看 Python 3. x 毕 竟 是 大 势 所 趋 , 如 果 你 暂时 还 没 想 到 要 做 什么 行 
业 领 域 的 应 用 开发 ,或 者 仅仅 是 为 了 尝试 一 种 新 的 ,好 玩 的 语言 ,那么 请 毫 不 犹 汪 地 选择 
Python 3. x 系列 的 最 高 版 本 (目前 正式 发 行 版 最 高 版 本 是 Python 3. 5. 1)。 

安装 好 Python 以 后 ,在 “开始 ”菜单 中 选择 IDLE(Python GUD) 命 令 , 即 可 启动 Python 
解释 器 并 可 以 看 到 当前 安装 的 Python 版 本 号 ,如 图 1-1 和 图 1-2 所 示 。 当 然 , 如 果 你 喜欢 ， 
也 可 以 启动 Python(command line) 来 开始 美妙 的 Python 之 旅 。 在 IDLE(Python GUD Ail 
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Python(command line) 两 种 界面 中 ,都 以 3 个 大 于 号 之 > 作为 提示 符 , 可 以 在 提示 符 后 面 输 
和 要 执行 的 语句 。 在 本 书 所 有 章节 给 出 的 示例 代码 中 ,>>> 符号 都 不 需要 输入 , 仅 表 示 该 代 
码 是 在 交互 模式 下 运行 ,而 不 带 该 提示 符 的 代码 则 表示 是 以 脚本 程序 的 方式 运行 的 。 本 书 
主要 使 用 IDLE(Python GUD 环境 来 介绍 Python 程序 的 开发 与 应 用 ,读者 也 可 以 选择 
wingIDE、PyCharm、Pythonwin 或 其 他 开发 环境 。 


LA Python 2.7.11 Shell al Bg 
EA saree | 


Python 2.7.11 (v2.7. 11:6d1b6a68£775, Dec 5 2015 
> 20:32:19) [MSC v, 1500 32 bit (Intel)] on win32 
Type “copyright”, “credits” or “license()” for m 
gre inforastion. 

>> 


图 1-1 Python 2.7.11 主 界面 


Lg Python 3.5.1 Shell 


File Edit Shell Debug Options Window Help 


Python 3.5.1 (v3.5. 1:37a07cee5969, Dec 6 2015, 
01:54:25) [MSC v.1900 64 bit (AD54)] on win32 


Type “copyright”, “credits” or “license()” for m 
ore information. 
>>> 


图 1-2 Python 3.5.1 主 界面 


除了 在 启动 主 界面 上 查看 已 安装 的 Python 版 本 之 外 ,还 可 以 使 用 下 面 的 命令 随时 
查看 。 

>>> import sys 

>>> sys.version 

"3.5.1 (v3.5.1:37a07cee5969, Dec 6 2015, 01:54:25) [MSC v.1900 64 bit (AMD64)]' 

>>> sys.winver 

"3.5" 

>>> sys.version_info 

sys.version_info(major=3, minor=5, micro=1, releaselevel='final', serial=0) 

有 时 候 可 能 需要 同时 安装 多 个 不 同 的 版 本 ,例如 ,同时 安装 Python 2.7, 11 和 Python 3. 4. 3 
以 及 Python 3. 5. 1 ,并 根据 不 同 的 开发 需求 在 两 个 版 本 之 间 进 行 切换 。 多 版 本 并 存 一 般 不 
影响 在 IDLE 环境 中 直接 运行 程序 ,只 需要 启动 相应 版 本 的 IDLE 即 可 。 在 命令 提示 符 环 
境 中 运行 Python 程序 时 ,如 果 无 法 正确 运行 ,可 以 尝试 在 调用 Python 主 程序 时 指定 其 完 
整 路 径 ,或 者 通过 修改 系统 Path 变量 来 实现 不 同 版 本 之 间 的 切换 。 在 Windows 7 系统 下 
修改 系统 Path 变量 的 步骤 为 : 单 击 “ 开 始 "菜单 , 右 击 “计算 机 ”并 执行 “属性 ”命令 ,在 弹出 
的 对 话 框 中 单 击 “ 高 级 系统 设置 "选项 ,切换 至 “高 级 "选项 卡 , 单 击 “ 环 境 变 量 ” 按 钮 ,然后 修 
改 系 统 Path 变量 中 的 Python 安装 路 径 , 如 图 1-3 所 示 。 
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QOF sate > mamas > xe ~| || exe. P 
SH) SRO SEV IAM WMH) 
BIMET °- 
ee (seta [are] a amelae] 
= 要 进行 大 多 数 更 次 ， 您 人 
@ sa 性 能 
Q 高 和 系统 设 于 WAR. MEHA A Doc DAPRE 
ze a 本 
e rsm Files (x66)\Foxit So... 
BARES 一 SAFFDATAG\Fy thon Scripts | 
与 您 登录 有 关 的 点 面 设置 XUSERPROFILEX\AppDeta\Local \Tenp 
TBP MISFRPRNPTI FX\ AnnNata\l ocal\Ts 
(Ro...) (MG) (Mo) | 
apo 
Firei Reem PRBS 
ze 值 
Path C: \Python34\;C: eA 回 
PATHEXT COM; . EXE: . BAT; CMD; 
PEOCESSOR_AR .. AMD64 
558A PRnrFSSnR TN Intels Family Model SA St, psi 
Ste (R... | ee 
Windows Update q _ 
本 -ae ) (ma) 


HRUE: 


图 1-3 Windows 7 环境 中 系统 Path 变量 修改 方法 


1.2 Python 安装 与 简单 使 用 


Python 的 安装 很 简单 ,打开 Python 官方 主页 https://www. python. org/ 后 ,选择 适合 
自己 的 版 本 下 载 并 安装 即 可 。 如 果 使 用 的 是 Linux 系统 ,例如 Ubuntu', 那 么 很 可 能 已 经 预 
装 了 某 个 版 本 的 Python, 请 根据 需要 进行 升级 。 若 未 经 特别 说 明 , 本 书 所 有 示例 均 在 
Windows 7 平台 上 使 用 Python 3. 5. 1 进行 演示 ,个 别 案例 适当 补充 了 3.4.x 和 2.7.x 的 
用 法 。 

安装 好 以 后 ,默认 以 IDLE 为 开发 环境 。 本 书 均 以 IDLE 为 例 ,如 果 使 用 交互 式 编程 模 
式 , 那 么 直接 在 IDLE 提示 符 >>> 后 面 输入 相应 的 命令 并 回 车 执行 即 可 ,如 果 执 行 顺利 ,马上 
就 可 以 看 到 执行 结果 ,和 否则 会 抛 出 异常 。 


>>> 3+5 

8 

>>> import math + 导入 标准 库 math 

>>> math. sqrt (9) # OR 9 的 平方 根 ,等 价 于 9x * 0.5 
3.0 


>>> 3* (2+6) 
24 
>>> 2/0 


ZeroDivisionError: integer division or modulo by zero 


一 般 来 讲 , 可 能 更 需要 编写 Python 程序 来 实现 特定 的 业务 逻辑 ,同时 也 方便 代码 的 不 
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断 完善 和 重复 利用 。 在 IDLE 界面 中 使 用 菜单 File->New File 命令 ,创建 一 个 程序 文件 , 输 
入 代码 并 保存 为 文件 (务必 保证 扩展 名 为 by, 如 果 是 GUI 程序 ,可 以 保存 为 . pyw 文件 。 可 
以 使 用 菜单 Run—Check Module 命令 来 检查 程序 中 是 否 存在 语法 错误 ,或 者 使 用 菜单 Run 
一 Run Module 命令 运行 程序 ,程序 运行 结果 将 直接 显示 在 IDLE 交互 界面 上 。 除 此 之 外 ， 
也 可 以 通过 在 资源 管理 器 中 双击 扩展 名 为 py 或 pyc 的 Python 程序 文件 直接 运行 ;在 有 些 
情况 下 ,可 能 还 需要 在 命令 提示 符 环境 中 运行 Python 程序 文件 。 选 择 *“ 开 始 ”-~* 所 有 程 
序 ”- 盖 附件 ”一 命令 提示 符 ” 命 令 ,然后 执行 Python 程序 。 例 如 ,假设 有 程序 HelloWorld. 
py 内 容 如 下 : 


def main(): 
print ("Hello world') 


main () 
在 IDLE 环境 中 运行 该 程序 结果 如 图 1-4 所 示 。 在 命令 提示 符 环境 中 运行 该 程序 的 方法 与 
结果 如 图 1-5 所 示 ,该 图 中 演示 了 两 种 执行 Python 程序 的 方法 ,虽然 第 二 种 方法 看 上 去 更 
简单 ,但 是 请 尽量 使 用 第 一 种 方法 来 运行 Python 程序 ,否则 可 能 会 影响 某 些 程序 的 正确 


运行 。 

:NPython35>python helloworld.py 
lello world 

SD aan ETAT 

= = \Python35 >he Lloworld.py 

»> ello world 

Hello world 

>> = \Python35> 


图 1-4 在 IDLE 中 运行 程序 图 1-5 在 命令 提示 符 中 运行 程序 


在 实际 开发 中 ,如 果 用 户 能 够 熟练 使 用 集成 开发 环境 IDLE 提供 的 一 些 快捷 键 ,将 会 大 
幅度 提高 编写 速度 和 开发 效率 。 在 IDLE 环境 下 ,除了 撤销 (Ctrl 十 Z) 、 全 选 (Ctrl 十 A)、 复 
制 (Ctrl 十 C) ,粘贴 (Ctrl 十 V) 、 前 切 (Ctrl 十 X) 等 常规 快捷 键 之 外 ,其 他 比较 常用 的 快捷 键 如 


表 1-1 所 示 。 
表 1-1 IDLE 常用 快捷 键 
th 捷 键 功能 说 明 
Alt+P 浏览 历史 命令 (上 一 条 ) 
Alt+N 浏览 历史 命令 (下 一 条 ) 
Ctrl 十 F6 重启 Shell, 之 前 定义 的 对 象 和 导入 的 模块 全 部 失效 
Fl 打开 Python 帮助 文档 
Altt/ 自动 补 全 前 面 曾经 出 现 过 的 单词 ,如 果 之 前 有 多 个 单词 具有 相同 前 级 , 则 在 多 
个 单词 中 循环 以 供 选 择 
Ctrl 十 ] 缩 进 代 码 块 
Ctrl 十 [ 取消 代码 块 缩 进 
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续 表 
快 捷 键 功能 说 明 
Alt+3 注释 代码 块 
Alt 十 4 取消 代码 块 注释 


1.3 使 用 pip 管理 Python 扩展 库 


当前 ,pip 已 经 成 为 管理 Python 扩展 库 ( 或 模块 ,一 般 不 做 区 分 ) 的 主流 方式 ,使 用 pip 
不 仅 可 以 实时 查看 本 机 已 安装 的 Python 扩展 库 列表 ,还 支持 纯 Python 扩展 库 的 安装 、 升 
RAMA SPE. EJH pip 工具 管理 Python 扩展 库 只 需要 在 保证 计算 机 联网 的 情况 下 输 
入 几 个 命令 即 可 完成 , 极 大 地 方便 了 用 户 。 

对 于 Python 2.7.9 和 了 Python 3.4.0 之 前 的 版 本 ,需要 首先 安装 pip 命令 才能 使 用 ,而 
在 Python 2.7.9 以 及 Python 3.4.0 之 后 的 安装 包 中 已 经 集成 了 该 命令 ,不 需要 再 单独 安 
装 。 在 较 早 的 Python 版 本 中 安装 pip, 首 先 从 https://pypi. python. org/pypi/pip 下 载 文 
件 get-pip. py, 然 后 在 命令 提示 符 环 境 中 执行 下 面 的 命令 : 

python get- pip.py 
即 可 自动 完成 pip 的 安装 。 当 然 , 应 保证 计算 机 处 于 联网 状态 。 

安装 完成 以 后 ,可 以 在 命令 提示 符 环境 下 使 用 pip 来 完成 扩展 库 的 安装 、 升 级 、 印 载 等 操 
作 。 如 果 某 个 模块 无 法 使 用 pip 安装 ,很 可 能 是 该 模块 依赖 于 某 些 动态 链接 库 文件 ,此 时 需要 
登录 该 模块 官方 网 站 下 载 并 单独 安装 。 常 用 pip 命令 使 用 方法 如 表 1-2 所 示 。 

表 1-2 常用 pip 命令 使 用 方法 


pip 命令 示例 说 å 
pip install SomePackage 安装 SomePackage 模块 
pip list 列 出 当前 已 安装 的 所 有 模块 
pip install --upgrade SomePackage 升级 SomePackage 模块 
pip uninstall SomePackage 4% SomePackage 模块 
pip install somePackage. whl 使 用 whl 文件 直接 安装 SomePackage 


1.4 Python 基础 知识 


1.4.1 Python 对 象 模型 


对 象 是 Python 语言 中 最 基本 的 概念 之 一 .Python 中 的 一 切 都 是 对 象 。Python 中 有 许 
多 内 置 对 象 可 供 编程 者 直接 使 用 ,例如 数字 字符 串 .列表 、 元 组 字典、 集合 .del 命令 以 及 
cmp() ,len() \id() ,type() 等 大 量 内 管 函 数 , 表 1-3 中 列 出 了 其 中 一 部 分 常见 的 Python 对 象 
类 型 ;另外 ,有 些 对 象 需要 导入 特定 模块 (有 些 模块 需要 单独 安装 ) 后 才能 使 用 ,如 math 模 
块 中 的 正弦 函数 sin() 与 常量 pi,random 模块 中 的 随机 数 生成 函数 random() ,time 模块 中 
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用 于 返回 当前 时 间 的 函数 time() ,等 等 。 
表 1-3 Python 内 置 对 象 


对 象 类 型 示 例 对 象 类 型 示 例 
数字 1234, 3.14, 3+4j 文件 f=open(‘data. txt’, 'r') 
字符 串 'swfu', "I'm student", "Python" | 集合 set('abc'), {'a', 'b', 'c'} 
列表 [1, 2, 3],[a' b', Ce's 2]] 布尔 型 True, False 
字典 {1:'food' ,2:'taste', 3:'import') 空 类 型 None 
元 组 (2, —5, 6) 编程 单元 类 型 | KAE d EO 


1.4.2 Python 变量 


在 Python 中 ,不 需要 事先 声明 变量 名 及 其 类 型 ,直接 赋值 即 可 创建 各 种 类 型 的 变量 。 
例如 语 


>>> x=3 
创建 了 整 型 变量 x, 并 赋值 为 3, 再 如 语句 
>>> x= 'Hello world." 


创建 了 字符 串 变量 x, 并 赋值 为 "Hello world.'。 这 一 点 适用 于 Python 任意 类 型 的 对 象 。 

虽然 不 需要 在 使 用 之 前 显 式 地 声明 变量 及 其 类 型 ,但 是 Python 仍 属于 强 类 型 编程 语 
言 ,Python 解释 器 会 根据 赋值 或 运算 来 自动 推断 变量 类 型 。 每 种 类 型 支持 的 运算 也 不 完全 
一 样 ,因此 在 使 用 变量 时 需要 程序 员 自 己 确定 所 进行 的 运算 是 否 合适 ,以 免 出 现 异常 或 者 意 
料 之 外 的 结果 。 同 一 个 运算 符 对 于 不 同类 型 数据 操作 的 含义 和 计算 结果 也 是 不 一 样 的 ,后 
面 会 介绍 。 另 外 ,Python 还 是 一 种 动态 类 型 语言 ,也 就 是 说 ,变量 的 类 型 是 可 以 随时 变化 
的 ,下 面 的 代码 演示 了 Python 变量 类 型 的 变化 。 


>>> x=3 

>>> print (type (x) ) 
<class 'int'> 

>>> x= 'Hello world." 
>>> print (type (x) ) 
<class 'str'> 

>>> x= [1,2,3] 

>>> print (type (x) ) 
<class 'list'> 

>>> isinstance (3, int) 
True 

>>> isinstance ("Hello world', str) 


True 


其 中 ,内 置 函 数 type() 用 来 返回 变量 类 型 ,内 置 函 数 isinstance() 用 来 测试 对 象 是 否 为 指定 
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类 型 的 实例 。 代 码 中 首先 创建 了 整 型 变量 x, 然 后 又 分 别 创建 了 字符 串 和 列表 类 型 的 变量 
x。 当 创建 了 字符 串 类 型 的 变量 x 之 后 ,之 前 创建 的 整 型 变量 x 将 自动 失效 ,创建 列表 对 象 
x 之 后 ,之 前 创建 的 字符 串 变 量 x 将 自动 失效 。 可 以 将 该 模型 理解 为 “状态 机 ”, 在 显 式 修改 
其 类 型 或 删除 之 前 ,变量 将 一 直 保持 上 次 的 类 型 。 

在 大 多 数 情况 下 ,如 果 变 量 出 现在 赋值 运算 符 或 复合 赋值 运算 符 ( 例 如 十 = 、* 一 等 ) 的 
左边 则 表示 创建 变量 或 修改 变量 的 值 , 和 否则 表示 引用 该 变量 的 值 , 这 一 点 同样 适用 于 使 用 下 
标 来 访问 列表 、 字 典 等 可 变 序列 以 及 其 他 自 定义 对 象 中 元 素 的 情况 。 例 如 : 


>>> x=3 # 创 建 整 型 变量 

>>> print (x**2) 

9 

>>> x+=6 # 修 改变 量 值 

>>> print (x) # 读 取 变 量 值 并 输出 显示 
9 

>>> x= [1,2,3] # 创 建 列表 对 象 

>>> print (x) 

(1, 2, 31 

>>> x[1]=5 # 修 改 列表 元 素 值 

>>> print (x) # 输 出 显示 整个 列表 

iL. 5: 3] 

>>> print (x[2]) # 输 出 显示 列表 指定 元 素 
3 


字符 串 和 元 组 属于 不 可 变 序列 ,这 意味 着 不 能 通过 下 标的 方式 来 修改 其 中 的 元 素 值 , 例 
如 下 面 的 代码 试图 修改 元 组 中 元 素 的 值 时 抛 出 异常 。 


>>> x= (1,2,3) 

>>> print (x) 

(1, 2, 3) 

>>> x[1]=5 

TypeError: 'tuple' object does not support item assignment 


在 Python 中 ,允许 多 个 变量 指向 同一 个 值 ,例如 : 


>>> x=3 
>>> id (x) 
1786684560 
>>> yx 
>>> id(y) 
1786684560 


继续 上 面 的 示例 代码 ,需要 注意 的 是 , 当 为 其 中 一 个 变量 修改 值 以 后 ,其 内 存 地 址 将 会 
变化 ,但 这 并 不 影响 另 一 个 变量 。 例 如 ,接着 上 面 的 代码 继续 执行 下 面 的 代码 : 
>>> x+=6 


>>> id (x) 
1786684752 
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>> y 

3 

>>> id(y) 
1786684560 


在 这 段 代码 中 ,内 置 函 数 id() 用 来 返回 变量 所 指 值 的 内 存 地 址 。 可 以 看 出 ,在 Python 
中 修改 变量 值 的 操作 ,并 不 是 修改 了 变量 的 值 ,而 是 修改 了 变量 指向 的 内 存 地 址 。 这 是 因为 
Python 解释 器 首先 读 取 变量 x 原来 的 值 ,然后 将 其 加 6, 并 将 结果 存放 于 新 的 内 存 中 ,最 后 
将 变量 x 指向 该 结果 的 内 存 空 间 , 如 图 1-6 所 示 。 
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N 


Ny 


GA = 
(a) x=3 (b) x+=6 
图 1-6 Python 内 存 管理 模式 
Python 采用 的 是 基于 值 的 内 存 管理 方式 ,如 果 为 不 同 变量 赋值 为 相同 值 ,这 个 值 在 内 
存 中 只 有 一 份 , 多 个 变量 指向 同一 块 内 存 地 址 ,前 面 的 几 段 代码 也 说 明了 这 个 特点 。 再 如 下 


面 的 代码 : 
>>> x=3 >>> y=5 
>>> id (x) >>> id (y) 
10417624 10417600 
>>> y=3 >>> id (x) 
>>> id(y) 10417624 
10417624 


Python 具有 自动 内 存 管理 功能 ,会 跟踪 所 有 的 值 , 并 自动 删除 不 再 有 变量 指向 的 值 。 
因此 ,Python 程序 员 一 般 情 况 下 不 需要 太 多 考虑 内 存 管理 的 问题 。 尽 管 如 此 , 显 式 使 用 del 
命令 删除 不 需要 的 值 或 显 式 关闭 不 再 需要 访问 的 资源 , 仍 是 一 个 好 的 习惯 ,同时 也 是 一 个 优 
秀 程序 员 的 基本 素养 之 一 。 

最 后 ,在 定义 变量 名 的 时 候 , 需 要 注意 以 下 问题 。 

(1) 变量 名 必须 以 字母 或 下 划 线 开头 ,但 以 下 划 线 开头 的 变量 在 Python 中 有 特殊 含 
义 , 本 书后 面 第 6 章 会 详细 讲解 。 

(2) 变量 名 中 不 能 有 空格 以 及 标点 符号 (括号 .引号 .逗号 、 斜 线 线 、 冒 号 、 句 号 、 问 
号 等 ) 。 

(3) 不 能 使 用 关键 字 作为 变量 名 ,可 以 导入 keyword 模块 后 使 用 print (keyword. 
kwlist) 查 看 所 有 Python 关键 字 。 


>>> import keyword 
>>> keyword. kwlist 


['and', 'as', 'assert', "break", 'class', ‘continue’, 'def', 'del', 'elif', 'else', 'except', ' 
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exec', 'finally', 'for', 'from', 'global', ‘if', 'import', 'in', 'is', ‘lambda’, 'not', 'or', ' 
pass', 'print', 'raise', 'return', 'try', 'while', 'with', 'yield'] 

>>> and=3 

SyntaxError: invalid syntax 


(4) 不 建议 使 用 系统 内 置 的 模块 名 、 类 型 名 或 函数 名 以 及 已 导入 的 模块 名 及 其 成 员 名 
作为 变量 名 ,这 将 会 改变 其 类 型 和 含义 ,可 以 通过 dir( builtins _) 查 看 所 有 内 置 模块 .类 
型 和 函数 。 

(5) 变量 名 区 分 英文 字母 的 大 小 写 , 例 如 student 和 Student 是 不 同 的 变量 。 


1.4.3 数字 


数字 属于 Python 不 可 变 对 象 , 即 修改 整 型 变量 值 的 时 候 并 不 是 真 的 修改 变量 的 值 ,而 
是 先 把 值 存放 到 内 存 中 然后 修改 变量 使 其 指向 了 新 的 内 存 地 址 , 浮 点 数 、 复 数 等 数字 类 型 以 
及 其 他 类 型 的 变量 具有 同样 的 特点 。 

在 Python 中 ,数字 类 型 变量 可 以 表示 任意 大 的 数值 。 


>>> a= 99999999999999999999999999999999 

>>> ata 
9999999999999999999999999999999800000000000000000000000000000001L, 

>>> a**3 
99999999999999999999999999999997000000000000000000000000000000029999999999 
9999999999999999999999L 


如 果 你 愿意 ,完全 可 以 把 IDLE 当做 计算 器 来 使 用 ,IDLE 可 以 实现 复杂 的 数学 运算 。 


>>> 3# (2+5)/3.0 


7.0 

>>> import math #math 是 Python 标准 库 , 其 中 包含 大 量 用 于 数学 计算 的 函数 
>>> math. sqrt (3**2+ 4**2) # 平 方 根 

5.0 


Python 数值 类 型 主要 有 整数 、 浮 点 数 和 复数 。 整 数 类 型 主要 如 下 。 
(1) 十 进 制 整数 ,如 0、-1、9、123。 


(2) 十 六 进 制 整数 ,使 用 16 个 数字 0、1、2、3、4、5、6、7、8、9、a、b、c、d、e、f 来 表示 整数 , 必 
须 以 Ox 开头 ,如 0x10、0xfa、0xabcdef。 

(3) 八进制 整数 ,使 用 8 个 数字 0、1、2、3、4、5、6、7 来 表示 整数 ,必须 以 Oo 开头 ,如 
0035、0011。 


(4) 二 进 制 整数 ,使 用 2 个 数字 0、1 来 表示 整数 ,必须 以 Ob 开头 ,如 0b101、0b100。 

浮 点 数 也 称 小 数 ,. 3,15. 0,0. 37,-11. 2,1. 2e2 314. 15e-2 都 是 合法 的 浮 点 数 。 

Python 中 的 复数 与 数学 中 复数 的 形式 完全 一 致 ,都 是 由 实 部 和 虚 部 构成 的 ,并 且 使 用 j 
ak J RA HEM 

>>> a= 34 45 


>>> b= 5+ 6j 


>>> c=atb 
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>>> c 

(8+ 103) 

>>> c.real # 查 看 复数 实 部 
8.0 

>>> c.imag # 查 看 复数 虚 部 
10.0 

>>> a.conjugate () HE [a] Sk He A 
(3-43) 

>>> ax b # 复 数 乘法 

(~ 9+ 38j) 

>>> a/b # 复 数 除法 


(0.6393442622950819+ 0.03278688524590165j) 


1.4.4 FFR 


在 Python 中 ,字符 串 属于 不 可 变 序 列 , 一 般 使 用 单 引号 、 双 引号 或 三 引号 进行 界定 ,并 
上 且 单 引号 、 双 引号 三 单 引 号 三 双 引 号 还 可 以 互相 骨 套 ,用 来 表示 复杂 字符 串 。 例 如 


tabc', '123', "p H ', "Python", "Tom said, "Let's go"™ 


都 是 合法 字符 串 , 空 字符 串 表示 为 "或 "或 " ", 即 一 对 不 包含 任何 内 容 的 任意 字符 串 界 定 
符 。 特 别 地 ,一 对 三 单 引 号 或 三 双 引 号 表示 的 字符 串 支持 换行 ,支持 排版 格式 较为 复杂 的 字 
符 串 ,也 可 以 在 程序 中 表示 较 长 的 注释 ,在 第 4 章 和 第 5 章 中 将 分 别 进行 介绍 。 

由 于 字符 串 类 型 应 用 非常 广泛 ,其 支持 的 操作 也 较 多 ,这 里 先 简单 介绍 一 下 ,第 4 章 再 
结合 正则 表达 式 全 面 展开 进行 详细 讲解 。 

字符 串 支持 使 用 + 运算 符 进 行 合并 以 生成 新 字符 串 。 

>>> a= 'abc'+ 1123" 

>>> a 

'abc123' 


可 以 对 字符 串 进行 格式 化 ,把 其 他 类 型 对 象 按 格式 要 求 转换 为 字符 串 ,并 返回 结果 字符 
串 , 例 如 下 面 的 代码 : 


>>> a=3.6674 

>>> '$7.3£' ta 

' 3.667' 

>>> "%d:%c"% (65, 65) 

"65:A' 

>>> """My name is %s, and my age is %d"""$ ("Dong Fuguo', 38) 
"My name is Dong Fuguo, and my age is 38" 


Python 支持 转 义 字符 ,常用 的 转 义 字符 如 表 1-4 所 示 。 

需要 特别 说 明 的 是 ,字符 串 界 定 符 前 面 加 字母 + 或 R 表示 原始 字符 串 , 其 中 的 特殊 字符 
不 进行 转 义 ,但 字符 串 的 最 后 一 个 字符 不 能 是 \ 符 号 。 原 始 字符 串 主要 用 于 正则 表达 式 , 也 
可 以 用 来 简化 文件 路 径 或 url 的 输入 ,请 参考 第 4 章 的 内 容 。 
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表 1-4 转 义 字符 
转 义 字符 会 转 义 字符 会 XA 
\n 换行 符 La 双 引 号 
Nt 制 表 符 \\ = 
\r 回 车 \ddd 3 位 八进制 数 对 应 的 字符 
y 单 引 号 \xhh 2 位 十 六 进 制 数 对 应 的 字符 


1.4.5 运算 符 与 表达 式 


与 其 他 语言 一 样 ,Python 支持 大 多 数 算术 运算 符 、 关 系 运算 符 、 修 辑 运算 符 以 及 位 运算 
符 , 并 遵循 与 大 多 数 语言 一 样 的 运算 符 优 先 级 。 除 此 之 外 ,还 有 一 些 运 算 符 是 Python 特有 
的 ,例如 成 员 测试 运算 符 、 集 合 运 算 符 、 同 一 性 测试 运算 符 等 。 男 外 ,Python 很 多 运算 符 具 
有 多 种 不 同 的 含义 ,作用 于 不 同类 型 操作 数 的 含义 并 不 相同 ,非常 灵活 。Python 运算 符 如 


K 1-5 所 示 。 


表 1-5 Python 运算 符 


运算 符 示例 功能 说 明 
x+y 算术 加 法 ,列表 、 元 组 ,字符 串 合 并 
xy 算术 减法 ,集合 差 集 
x*y 乘法 ,序列 重复 
x/y 除法 (在 Python 3. x 中 叫做 真 除法 ) 
x//y 求 整 商 
-x 相反 数 
x%y 余数 (对 实数 也 可 以 进行 余数 运算 ) ,字符 串 格 式 化 
x*žy TZA 


X<y;x<=y;X>y;X>=y 


大 小 比较 (可 以 连用 ) ,集合 的 包含 关系 比较 


x= Syrsl=y¥ 相等 ( 值 ) 比 较 , 不 等 ( 值 ) 比 较 
xory 逻辑 或 (只 有 x 为 假 才 会 计算 y) 
x and y 逻辑 与 (只 有 x 为 真 才 会 计算 y) 
not x 逻辑 非 

x in y;x not in y 成 员 测试 运算 符 

x is y;x is not y 对 象 实体 同一 性 测试 (地 址 ) 
RENNE 位 运算 符 

| 集合 交集 、 并 集 、 对 称 差 集 

@ 矩阵 乘法 


需要 说 明 的 是 ,Python 中 的 除法 有 两 种 : /和 // 分 别 表示 除法 和 整除 运算 ,并 且 Python 
2.x 和 Python 3. x 对 /运算 符 的 解释 也 略 有 区 别 。Python 2. x 将 /解释 为 普通 除法 ,而 
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Python 3. x 将 其 解释 为 真 除法 。 例 如 ,在 Python 3. 5. 1 中 运算 结果 如 下 : 


>>> 3/5 
0.6 

>>> 3//5 

0 

>>> 3.0/5 
0.6 

>>> 3.0//5 
0.0 

>>> 13//10 
1 

>>> -13//10 
=2 


而 上 面 的 表达 式 在 Python 2.7.11 中 运算 结果 如 下 : 


>>> 3/5 

0 

>>> 3//5 

0 

>>> 3.0/5 
0.6 

>>> 3.0//5 
0.0 

>>> 13//10 
和 

>>> -13//10 


-2 


% 在 Python 中 除去 前 面 已 经 介绍 过 的 字符 串 格式 化 用 法 之 外 ,还 可 以 对 整数 和 浮 点 


数 计算 余数 。 但 是 由 于 浮 点 数 的 精确 度 影响 ,计算 结果 可 能 略 有 误差 。 


>>> 3.182 

1.1 

>>> 6.3%2.1 
2.0999999999999996 
>>> 682 

0 

>>> 6.082 

0.0 

>>> 6.0%2.0 

0.0 

>>> 5.7%4.8 
0.9000000000000004 


如 前 所 述 ,Python 中 很 多 运算 符 有 多 重 含义 ,在 程序 中 运算 符 的 具体 含义 取决 于 操作 


数 的 类 型 ,将 在 第 2 章 中 根据 内 容 组 织 的 需要 陆续 展开 。 例 如 , x 运算 符 就 是 Python 运算 
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符 中 比较 特殊 的 一 个 , 它 不 仅 可 以 用 于 数值 乘法 ,还 可 以 用 于 列表 、 字 符 串 、 元 组 等 类 型 , 当 
列表 、 字 符 串 或 元 组 等 类 型 变量 与 整数 进行 * 运算 时 ,表示 对 内 容 进行 重复 并 返回 重复 后 的 


新 对 象 。 
>>> 3* 2 # 整 数 相 乘 
6 
>>> 2.0% 3 # 浮 点 数 与 整数 相 乘 
6.0 
>>> (3445) * 2 # 复 数 与 整数 相 乘 
(6+ 83) 
>>> (3+4j) * (3-45) # 复 数 与 复数 相 乘 
(25+ 03) 
>>> '1'#5 # 字 符 串 重复 
"19011" 
>>> "a" * 10 FF FF 
“aaaaaaaaaa' 
>>> [1,2,3] * 3 # 列 表 重 复 
名 
>>> (1,2,3) * 3 # 元 组 重复 
2 
>>> 3x 'a' # 字 符 串 重 复 
Cag 


在 Python 中 ,单个 任何 类 型 的 对 象 或 常数 属于 合法 表达 式 , 使 用 表 1-5 中 运算 符 连 接 


的 变量 和 常量 以 及 函数 调用 的 任意 组 合 也 属于 合法 的 表达 式 。 


>>> a= [1,2,3] 

>>> b= [4,5,6] 

>>> c=atb 

>>> c 

[1, 2, 3, 4, 5, 6] 

>>> d= list (map(str, c)) 
>>> d 

f°", *2",, "38, "47, 158, S68 
>>> import math 


>>> list (map (math.sin, c)) 


[0.8414709848078965, 0.9092974268256817, 0.1411200080598672, - 0.7568024953079282, 


— 0.9589242746631385, — 0.27941549819892586] 
>>> 'Hello'+' '+ 'world' 
"Hello world’ 

>>> 'welcome ' * 3 
"welcome welcome welcome ' 

>>> ('welcome, ' * 3).rstrip(',')+'!" 


'welcome, welcome, welcome! * 


最 后 ,在 Python PEG“, "FF AN ee HF FE ,而 只 是 一 个 普通 分 隔 符 。 


RE 
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3> ta in b, a 
(False, 'a') 

>>> 'a' in ('b', 'a') 
True 

>>> x=3, 5 

>>> x 

(3, 5) 

>>> 3==3, 5 

(True, 5) 


>>> x=3+5, 7 


>>> x 

(8, 7) 

Python 3. 5 增加 了 一 个 新 的 矩阵 相 乘 运算 符 @ ,下 面 的 代码 演示 了 该 运算 符 的 用 法 。 
>>> import numpy # numpy 是 用 于 科学 计算 的 Python 扩展 库 

>>> x= numpy.ones (3) # ones () 函 数 用 于 生成 全 1 矩阵 ,参数 表示 矩阵 大 小 

>>>m= numpy.eye(3) * 3 + eye () 函 数 用 于 生成 单位 矩阵 

>>>m[0,2]=5 # 设 置 矩 阵 指定 位 置 上 元 素 的 值 

>>>m[2, 0] =3 

>>>x @m # 和 矩阵 相 乘 


array([ 6., 3., 8.]) 


14.6 常用 内 置 函数 


内 置 函 数 是 指 不 需要 导入 任何 模块 即 可 直接 使 用 的 函数 ,例如 ,在 1.4.5 节 例 子 中 用 到 
的 mapO 〇 函数 即 属于 Python 内 置 函 数 ,因此 不 需要 导入 任何 模块 就 可 以 直接 使 用 ,该 函数 
在 本 书后 面 会 有 讲解 ,当然 你 也 可 以 直接 跳 至 第 5 章 阅 读 ,或 者 使 用 help (map) KA A i% K 
数 帮助 文档 学 习 。 
执行 下 面 的 命令 可 以 列 出 所 有 内 牌 函 数 和 内 置 对 象 : 
>>> dir( builtins ) 
Python 常用 的 内 置 函 数 及 其 功能 简要 说 明 如 表 1-6 所 示 。 
表 1-6 Python 常用 内 置 函数 ( 方 括号 表示 可 选 参数 ) 及 其 功能 简要 说 明 
K 数 功能 简要 说 明 


abs(x) 返回 数字 x 的 绝对 值 

如 果 对 于 可 和 迭代 对 象 中 所 有 元 素 x 都 有 bool(x) 为 True, 则 
返回 True。 对 于 空 的 可 和 迭代 对 象 也 返回 True 

只 要 可 和 迭代 对 象 中 存在 元 素 x 使 得 bool(x) 为 True, 则 返回 
True。 对 于 空 的 可 和 迭代 对 象 , 返 回 False 

bin(x) 把 数字 x 转换 为 二 进 制 串 

测试 对 象 是 否 可 调用 。 类 和 函数 是 可 调用 的 ,包含 _call_O 〇 方 
法 的 类 的 对 象 也 是 可 调用 的 


all(iterable) 


any(iterable) 


callable( object) 
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BER 


功能 简要 说 明 


返回 ASCII 编码 (Python 2. x) 或 Unicode 编码 (Python 3. x) 


chr(x) 为 x 的 字符 

sant 比较 大 小 ,如 果 x<y, 则 返回 负数 ;如 果 x==y, 则 返回 0; 如 果 
jika x>y 则 返回 正 数 。Python 3. x 不 再 支持 该 函数 

dir(x) 返回 指定 对 象 或 模块 的 成 员 列表 

eval(s[ ,globals[ ,locals]]) 计算 字符 串 中 表达 式 的 值 并 返回 


filter(function or None, sequence) 


返回 包含 序列 中 使 得 函数 值 为 True 的 那些 元 素 的 filter 对 
象 , 如 果 函 数 为 None, 则 返回 那些 值 等 价 于 True 的 元 素 


float(x) 把 数字 或 字符 串 x 转 换 为 浮 点 数 并 返回 

help(obj) 返回 对 象 obj 或 模块 的 帮助 信息 

hex(x) 把 数字 x 转换 为 十 六 进 制 串 

id(obj) 返回 对 象 obj 的 标识 (地 址 ) 

input RAED 骇 西数 的 人 和 不 完 全 HELE 
int(x[,d]) 返回 数字 的 整数 部 分 ,或 把 d 进 制 的 字符 串 x 转换 为 十 进 制 


并 返回 ,d 默认 为 10 


isinstance( object, class-or-type-or-tuple) 


测试 对 象 是 否 属于 指定 类 型 的 实例 


len(obj) 


返回 对 象 obj 包含 的 元 素 个 数 ,适用 于 列表 、 元 组 .集合 、 字 
典 ,字符 串 等 类 型 的 对 象 


list([x]) 、set([x]) tuple([x])、 
dict([x]) 


把 对 象 转换 为 列表 、 集 合 、 元 组 或 字典 并 返回 ,或 生成 空 列表 、 
BIE TCH SFB 


map ( PH RK , FFF) 


将 单 参数 函数 映射 至 序列 中 每 个 元 素 ,返回 结果 列表 (Python 
2. x) 或 map 对 象 (Python 3. x) 


max(x), min(x)、 sum(x) 


返回 序列 中 的 最 大 值 .最 小 值 或 数值 型 序列 中 所 有 元 素 之 和 


oct(x) 


把 数字 x 转换 为 八进制 串 


open(name[ ,mode[ ,buffering]]) 


以 指定 模式 打开 文件 并 返回 文件 对 象 


ord(s) 


返回 一 个 字符 s 的 ,ASCII(Python 2. x) 或 Unicode(Python 3. x) 
编码 


pow(x,y) 


返回 x 的 y 次 方 ,等 价 于 xy 


range([start,] end [,step] ) 


返回 一 个 等 差 数列 列表 (Python 3. x 中 返回 一 个 range 对 
象 ) ,不 包括 终 值 


reduce( 函 数 , 序 列 ) 


将 接收 2 个 参数 的 函数 以 累积 的 方式 从 左 到 右 依次 应 用 至 序 
列 中 每 个 元 素 ,最 终 返 回 单个 值 作为 结果 ,在 Python 3. x 中 
需 从 functools 中 导入 


reversed( 列 表 或 元 组 ) 


返回 逆序 后 的 迭代 器 对 象 


round(x[, 小 数位 数 ]) 


对 x 进行 四 会 五 人 , 若 不 指定 小 数位 数 , 则 返回 整数 
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BER 
aA A 功能 简要 说 明 
str(obj) 把 对 象 obj 转换 为 字符 串 
MOPT e SE p I E Ai iaaa a ee 
type(obj) 返回 对 象 obj 的 类 型 


返回 [(seql[0],seq2[0] …),(…)] 形 式 的 列表 (Python 2. x) 


zip(seql [,seq2 […]]) 或 zip 对 象 (Python 3. x) 


由 于 内 置 函 数 众多 且 功 能 强大 ,很 难 一 下 子 全 部 解释 清楚 ,本 书 将 在 后 面 的 章节 中 根据 
内 容 组 织 的 需要 逐步 展开 并 演示 其 用 法 。 这 里 只 通过 几 个 例子 来 演示 部 分 内 管 函 数 的 使 
用 ,如 果 需 要 用 到 某 个 内 置 函 数 而 还 没有 看 到 本 书后 面 的 讲解 ,可 以 通过 内 置 函 数 help() 查 看 
函数 的 使 用 帮助 ,提前 学 习 。 作 为 一 个 建议 ,编写 程序 时 应 优先 考虑 使 用 内 转 函 数 ,因为 内 
置 函数 不 仅 成 熟 、 稳 定 , 而 且 速度 相对 较 快 。 

ord() 和 chr() 是 一 对 功能 相反 的 函数 ,ord() 用 来 返回 单个 字符 的 Unicode 编码 或 
ASCII 码 ,而 chr 〇 则 用 来 返回 指定 ASCII 码 (Python 2. x) 或 Unicode 编码 (Python 3. x) 对 应 的 
字符 ,str() 则 直接 将 其 任意 类 型 参数 转换 为 字符 串 。 下 面 的 代码 演示 了 这 几 个 函数 的 用 法 : 


>>> ord('A') 

65 

>>> chr (65) 

‘aA! 

>>> chr (ord('A')+1) 
1B 

>>> str(1) 

11 

>>> str (1234) 
"1234" 

>>> str ([1,2,3]) 
sn 2 BI 

>>> str((1,2,3)) 
s am 

>>> str({1,2,3}) 
"ts 


max()、min() ,sum() 这 3 个 内 置 函数 分 别 用 于 计算 列表 、 元 组 或 其 他 可 迭代 对 象 中 所 
有 元 素 最 大 值 . 最 小 值 以 及 所 有 元 素 之 和 ,sum() 只 支持 包含 数值 型 元 素 的 序列 或 可 迭代 对 
象 ,maxC) 和 min() 则 要 求 序 列 或 可 迭代 对 象 中 的 元 素 之 间 可 比较 大 小 。 例 如 下 面 的 示例 
代码 ,首先 使 用 列表 推导 式 生成 包含 10 个 随机 数 的 列表 ,然后 分 别 计算 该 列表 的 最 大 值 .最 
小 值 和 所 有 元 素 之 和 。 

>>> import random 


>>> a= [random.randint (1,100) for i in range (10) ] 


>>> a 
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[72, 26, 80, 65, 34, 86, 19, 74, 52, 40] 
>>> print (max (a), min (a), sum(a)) 

86 19 548 

>>> max(['aa', 'b'], key= len) 

aa 


很 显然 ,如 果 需 要 计算 该 列表 中 的 所 有 元 素 的 平均 值 , 可 以 直接 使 用 下 面 的 方法 ， 


>>> a= [72, 26, 80, 65, 34, 86, 19, 74, 52, 40] 


>>> sum(a) * 1.0/len (a) #Python 2.7.11 
54.8 

>>> sum(a) /len (a) #Python 3.5.1 
54.8 


对 于 初学 者 而 言 ,也 许 dirO Al helpO ix HA A F K BCE te AI. E dir) 函数 可 
以 查看 指定 模块 中 包含 的 所 有 成 员 或 者 指定 对 象 类 型 所 支持 的 操作 ,而 help O 函数 则 返回 
指定 模块 或 函数 的 说 明文 档 , 这 对 于 了 解 和 学 习 新 的 模块 与 知识 是 非常 重要 的 ,能够 熟练 使 
用 这 两 个 函数 也 是 学 习 能 力 的 重要 体现 。 

下 面 的 代码 首先 导入 数学 模块 math, 然 后 查看 该 模块 的 常量 和 函数 ,并 查看 指定 函数 
的 使 用 帮助 : 


>>> import math 


>>> dir (math) # 查 看 模块 中 可 用 对 象 

>>> help (math. sqrt) # 查 看 指定 方法 的 使 用 帮助 
>>> help (math.sin) 

>>> dir (3+ 4j) # 查 看 数字 类 型 对 象 成 员 
>>> dir('') # 查 看 字符 串 类 型 成 员 


1.4.7 对 象 的 删除 


在 Python 中 ,可 以 使 用 del 命令 来 显 式 删除 对 象 并 解除 与 值 之 间 的 指向 关系 。 删 除 对 
象 时 ,如 果 其 指向 的 值 还 有 别 的 变量 指向 , 则 不 删除 该 值 ; 如 果 删 除 对 象 后 该 值 不 再 有 其 他 
变量 指向 , 则 删除 该 值 。 例 如 下 面 的 代码 所 示 : 


>>> x= [1,2,3,4,5,6] 

>>> y=3 

>>> z=y 

>>> print (y) 

3 

>>> del y # 删 除 对 象 
>>> print (y) 

NameError: name 'y' is not defined 
>>> print (z) 

3 

>>> del z 
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>>> print (z) 

NameError: name 'z' is not defined 

>>> del x[1] # 删 除 列表 中 指定 的 元 素 
>>> print (x) 

[1, 3, 4, 5, 6] 

>>> del x # 删 除 整个 列表 

>>> print (x) 


NameError: name 'x' is not defined 


正如 运行 结果 所 示 ,变量 y 和 z 指向 同一 个 值 , 删 除 变量 y 以 后 该 值 仍 存在 且 被 z 所 指 
向 。 另 外 ,del 命令 可 以 用 来 删除 列表 或 其 他 可 变 序 列 中 的 指定 元 素 , 也 可 以 删除 整个 列表 
或 其 他 类 型 序列 对 象 。 列 表 中 部 分 元 素 删除 以 后 ,列表 会 自动 收缩 其 内 存 空间 以 保证 各 元 
素 连续 存储 ,这 在 第 2 章 会 详细 介绍 del 命令 无 法 删除 元 组 或 字符 串 中 的 指定 元 素 ,而 只 
可 以 删除 整个 元 组 或 字符 串 , 因 为 这 两 者 均 属 于 不 可 变 序列 。 


>>> x= (1,2,3) 

>>> del x[1] 

TypeError: 'tuple' object doesn't support item deletion 
>>> del x 

>>> print (x) 


NameError: name 'x' is not defined 


1.4.8 基本 输入 输出 


在 Python 中 ,使 用 内 置 函 数 input() 来 接收 用 户 的 键盘 输入 ,input() 函数 的 一 般 用 
法 为 
x= input (' 提 示 : ') 


该 函数 返回 用 户 输入 的 对 象 。 

尽管 形式 一 样 ,Python 2. x 和 Python 3. x 对 该 函数 的 解释 略 有 不 同 。 在 Python 2. x 
中 ,该 函数 返回 结果 的 类 型 由 输入 值 时 所 使 用 的 界定 符 来 决定 ,例如 下 面 的 Python 2. 7. 11 
代码 : 


>>> x= input ("Please input:") 

Please input:3 # 没 有 界定 符 ,整数 
>>> print type (x) 

<type 'int'> 

>>> x= input ("Please input:") 

Please input:'3' # 单 引号 ,字符 串 
>>> print type (x) 

<type 'str'> 

>>> x= input ("Please input:") 

Please input: [1,2,3] # 方 括号 ,列表 
>>> print type (x) 

<type 'list'> 
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在 Python 2.x 中 ,还 有 另外 一 个 内 置 函 数 raw_input() 也 可 以 用 来 接收 用 户 输入 的 值 。 
与 input() 函 数 不 同 的 是 ,raw_input() 函 数 返回 结果 的 类 型 一 律 为 字符 串 , 而 不 论 用 户 使 用 
什么 界定 符 。 例 如 : 


>>> x= raw input ("Please input:") 
Please input: [1,2,3] 
>>> print type (x) 


<type 'str'> 


在 Python 3.x 中 ,不 存在 raw_input© PAK, APE PET input() 函 数 用 来 接收 用 户 的 键 
盘 输入 。 在 Python 3. x 中, 不论 用 户 输入 数据 时 使 用 什么 界定 符 ,input() 函数 的 返回 结果 
都 是 字符 串 , 需 要 将 其 转换 为 相应 的 类 型 再 处 理 ,相当 于 Python 2. x 中 的 raw_input© PAK. 
例如 下 面 的 Python 3.5.1 代码 : 


>>> x= input ('Please input:') 

Please input:3 

>>> print (type (x) ) 

<class 'str'> 

>>> x= input ("Please input:') 

Please input:'1' 

>>> print (type (x) ) 

<class 'str'> 

>>> x= input ("Please input:') 

Please input: [1,2,3] 

>>> print (type (x) ) 

<class 'str'> 

>>> x= raw_input ('Please input:') 

NameError: name 'raw_input' is not defined 

Python 2. x il Python 3. x 的 输出 方法 也 不 完全 一 致 。 在 Python 2. x 中 ,使 用 print if 
句 输出 ,而 Python 3. x 中 使 用 print() 函数 输出 .上 面 的 例子 已 经 说 明了 这 个 区 别 。 在 本 书 
给 出 的 代码 中 ,大 部 分 是 在 Python 3. 5. 1 环境 下 编写 的 ,也 有 少量 代码 是 使 用 Python 2. 7. 11 
编写 的 ,这 是 因为 有 的 扩展 库 暂 时 还 不 支持 Python 3. x, 并 且 目 前 仍 有 大 量 的 开发 人 员 使 
用 Python 2. x。 

默认 情况 下 ,Python 将 结果 输出 到 IDLE 或 者 标准 控制 台 , 在 输出 时 也 可 以 重 定向 , 例 
如 可 以 把 结果 输出 到 指定 文件 。 在 Python 2.7. 11 中 使 用 下 面 的 方法 输出 重 定向 : 


>>> fp=open(r'C:\mytest.txt', 'at') 
>>> print>> fp, "Hello,world" 


>>> fp.close () 
而 在 Python 3. 5. 1 中 则 需要 使 用 下 面 的 方法 重 定向 : 


>>> fp=open (r'D:\mytest.txt', 'at') 
>>> print ('Hello,world!', file= fp) 
>>> fp.close () 
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另外 一 个 重要 的 不 同 是 ,对 于 Python 2.x 而 言 , 在 print 语句 之 后 加 上 有 逗号 “,” 则 表示 
输出 内 容 之 后 不 换行 ,例如 : 


>>> for i in range(10): 
print i, 
0123456789 


在 Python 3.x 中 ,为 了 实现 上 述 功 能 则 需要 使 用 下 面 的 方法 : 


>>> for in range(10,20) : 
print (i, end=' ') 
10 11 12 13 14 15 16 17 18 19 


在 这 两 个 示例 中 ,range() 是 内 置 函 数 ,用 来 生成 一 个 列表 (Python 2. x) 或 迭代 对 象 
(Python 3. x) ,相信 读者 已 经 了 解 了 该 函数 的 基本 用 法 ,更 加 详细 和 巧妙 的 用 法 将 会 在 后 面 
章节 中 逐步 展开 。 


1.4.9 模块 导入 与 使 用 


Python 默认 安装 仅 包含 部 分 基本 或 核心 模块 ,但 用 户 可 以 很 方便 地 安装 大 量 的 其 他 扩 
展 模块 ,pip 是 管理 扩展 模块 的 重要 工具 。 同 样 , 在 Python 启动 时 ,也 仅 加 载 了 很 少 的 一 部 
分 模块 ,在 需要 时 由 程序 员 显 式 地 加 载 ( 有 些 模块 可 能 需要 先 安装 ) 其 他 模块 。 这 样 可 以 减 
小 程序 运行 的 压力 , 仅 加 载 真 正 需 要 的 模块 和 功能 , 且 具 有 很 强 的 可 扩展 性 。 可 以 使 用 
sys. modules, items() 显 示 所 有 预 加 载 模块 的 相关 信息 。 

1. import 模块 名 [as 别名 ] 

使 用 这 种 方式 导入 以 后 ,需要 在 要 使 用 的 对 象 之 前 加 上 前 级 , 即 以 “模块 名 . 对 象 名 ”的 
方式 访问 。 也 可 以 为 导入 的 模块 设置 一 个 别名 ,然后 可 以 使 用 “别名 . 对 象 名 ”的 方式 来 使 用 
其 中 的 对 象 。 


>>> import math 

>>> math.sin (0.5) # 求 0.5 的 正弦 
0.479425538604203 

>>> import random 

>>> x= random. random () # 获 得 [0,1) 内 的 随机 小 数 
>>> y= random. random () 


>>> n= random. randint (1, 100) # 获 得 [1,100] 区 间 上 的 随机 整数 


>>> import numpy as np # 导 入 模块 并 设置 别名 
>>> a=np.array ((1,2,3,4)) # 通 过 模块 的 别名 来 访问 其 中 的 对 象 
>>>a 


array([1, 2, 3, 4]) 


2. from 模块 名 import 对 象 名 [as 别名 ] 

使 用 这 种 方式 仅 导入 明确 指定 的 对 象 ,并 且 可 以 为 导入 的 对 象 起 一 个 别名 。 这 种 导入 
方式 可 以 减少 查询 次 数 ,提高 访问 速度 ,同时 也 减少 了 程序 员 需 要 输入 的 代码 量 , 而 不 需要 
使 用 模块 名 作为 前 级 。 例 如 : 


20 
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>>> from math import sin 
>>> sin (3) 

0.1411200080598672 

>>> from math import sin as f 
>>> £(3) 

0.1411200080598672 


比较 极端 的 情况 是 一 次 导入 模块 中 所 有 对 象 ,例如 
from math import * 


使 用 这 种 方式 固然 简单 省 事 , 但 是 并 不 推荐 使 用 ,一 旦 多 个 模块 中 有 同名 的 对 象 , 这 种 


方式 将 会 导致 混乱 。 


在 测试 自己 编写 的 模块 时 ,可 能 需要 频繁 地 修改 代码 并 重新 导入 模块 ,在 Python 2. x 


中 可 以 使 用 内 置 方法 reload() 重 新 导入 一 个 模块 ,而 在 Python 3. x 中 ,需要 使 用 imp 模块 
或 importlib 模块 的 reload() 函 数 。 不 论 使 用 哪 种 方法 重新 加 载 模块 ,都 要 求 该 模块 已 经 被 
正确 加 载 , 即 第 一 次 导入 和 加 载 模块 时 不 能 使 用 reload() 方 法 。 


在 导入 模块 时 ,Python 首先 在 当前 目录 中 查找 需要 导入 的 模块 文件 ,如 果 没 有 找到 , 则 


从 sys 模块 的 path 变量 所 指定 的 目录 中 查找 ,如 果 仍 没有 找到 模块 文件 , 则 提示 模块 不 存 
在 。 可 以 使 用 sys 模块 的 path 变量 查看 Python 导入 模块 时 搜索 模块 的 路 径 , 也 可 以 使 用 
append() 方 法 向 其 中 添加 自 定义 的 文件 夹 以 扩展 搜索 路 径 。 在 导入 模块 时 ,会 优先 导入 相 
应 的 . pyc 文件 ,如 果 相 应 的 . pyc 文件 与 . py 文件 时 间 不 相符 或 不 存在 对 应 的 . pyc 文件 , 则 
导入 . py 文件 并 重新 将 该 模块 文件 编译 为 . pyc 文件 。 关 于 Python 文件 名 的 详细 介绍 请 参 
考 1.6 节 的 内 容 。 


在 大 的 程序 中 可 能 会 需要 导入 很 多 模块 ,此 时 应 按照 这 样 的 顺序 来 依次 导入 模块 。 
(1) 导入 Python 标准 库 模块 ,如 os、sys、re。 

(2) 导入 第 三 方 扩展 库 , 如 PIL、numpy、scipy。 

(3) 导入 自己 定义 和 开发 的 本 地 模块 。 


1.5 Python 代码 编写 规范 


(1) 缩 进 。 
Python 程序 是 依靠 代码 块 的 缩 进 来 体现 代码 之 间 的 迎 辑 关系 的 。 对 于 类 定义 、 琐 数 定 


义 、. 选 择 结构 、 循 环 结构 以 及 异常 处 理 结构 来 说 , 行 尾 的 冒号 以 及 下 一 行 的 缩 进 表示 一 个 代 
码 块 的 开始 ,而 缩 进 结束 则 表示 一 个 代码 块 结 束 了 。 在 编写 程序 时 ,同一 个 级 别 的 代码 块 的 
缩 进 量 必须 相同 。 例 如 在 下 面 的 代码 中 ,最 后 一 个 else 子 句 中 的 代码 与 其 他 控制 结构 中 的 
代码 缩 进 量 不 同 ,但 这 并 不 影响 执行 ,因为 在 该 else 中 的 相同 级 别 代码 具有 相同 的 缩 进 量 。 
可 以 自行 测试 ,将 最 后 一 个 else 子 名 中 的 两 行 代码 修改 为 不 同 的 缩 进 量 , 则 IDLE 会 提示 不 
正确 的 缩 进 量 而 拒绝 执行 该 程序 。 


a, b, c=3, 4, 5 
if a>b: 
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if a>c: 
print (a) 
else: 
print (c) 
else: 
if b>es 
print (b) 
else: 
print (c) 
print ('ok') 


尽管 上 面 的 代码 可 以 在 Python 3. 5. 1( 略 加 修改 后 在 Python 2. 7. 11) 环 境 中 正确 无 误 
地 运行 ,但 是 仍 建议 写 为 下 面 的 风格 , 即 具有 相同 缩 进 次 数 的 代码 具有 相同 的 缩 进 量 。 
a, b, c=3, 4, 5 
if a>b: 
if a>c: 
print (a) 
else: 
print (c) 
else: 
if b>c: 
print (b) 
else: 
print (c) 
print ('ok') 


在 IDLE 开发 环境 中 ,一 般 以 4 个 空格 为 基本 缩 进 单位 ,或 者 使 用 下 面 的 方式 来 修改 基 
本 缩 进 量 , 如 图 1-7 所 示 。 


IDLE Preferences 


Fonts/Tabs | Highlighting | Keys | General | 
p Base Editor Font 一 一 一 一 


Indentation Width 一 一 
| Font Face Python Standard: 4 Spaces! | 


一 一 一 
Courier New al = 
Seria See Batie = 246 810121416 | 
| Courier New 

| Courier New CYR 十 


| size: 18 一 | F Baa 


AaBbCcDdEe 
FfGgHhIiJjK 
1234567890 
#:4=(){} 0) 


| tomy | cmn | tar | 
图 1-7 IDLE 环境 中 基本 缩 进 量 的 设置 
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编写 程序 时 ,可 以 通过 下 面 的 菜单 进行 代码 块 的 批量 缩 进 和 反 缩 进 ,当然 需要 提前 将 需 
要 缩 进 或 反 缩 进 的 代码 块 选中 : 


Fortmat==> Indent Region/Dedent Region 


当然 ,也 可 以 使 用 快捷 键 Ctrl 十 ] 缩 进 ,使 用 快捷 键 Ctrl 十 [ 反 缩 进 。 

(2) 注释 。 

注释 对 于 程序 理解 和 团队 合作 开发 具有 非常 重要 的 意义 。 据 统计 ,一 个 可 维护 性 和 可 
读 性 都 很 强 的 程序 一 般 会 包含 30% 以 上 的 注释 。Python 中 常用 的 注释 方式 主要 有 两 种 。 

O 以 符号 # 开 始 ,表示 本 行 # 之 后 的 内 容 为 注释 。 

@ 包含 在 一 对 三 引号 ("…"”) 或 ("""…""") 之 间 且 不 属于 任何 语句 的 内 容 将 被 解释 器 
认为 是 注释 。 

在 IDLE 开发 环境 中 ,可 以 使 用 鼠标 选中 代码 块 ,然后 使 用 下 面 的 操作 快速 注释 /解除 
注释 代码 块 : 


Format==> Comment Out Region/Uncomment Region 


或 者 也 使 用 快捷 键 Alt 十 3 和 Alt 十 4 进行 代码 块 的 批量 注释 和 解除 注释 。 

(3) 每 个 import 语句 只 导入 一 个 模块 ,尽量 避免 一 次 导入 多 个 模块 。 

CA) 如 果 一 行 语句 太 长 ,可 以 在 行 尾 使 用 续 行 符 “\" 来 表示 下 面 紧 接 的 一 行 仍 属于 当前 
语句 ,但 是 一 般 建议 使 用 括号 来 包含 多 行内 容 。 

(5) 使 用 必要 的 空格 与 空 行 增强 代码 的 可 读 性 。 一 般 来 说 ,运算 符 两 侧 、 函 数 参数 之 
间 、` 逗 号 两 侧 建议 使 用 空格 进行 分 隔 ,而 不 同 功能 的 代码 块 之 间 、 不 同 的 函数 定义 以 及 不 同 
的 类 定义 之 间 则 建议 增加 一 个 空 行 以 增加 可 读 性 。 

(6) 适当 使 用 异常 处 理 结 构 提高 程序 容错 性 和 健壮 性 ,但 不 能 过 多 依赖 异常 处 理 结构 ， 
适当 的 显 式 判断 还 是 必要 的 。 

(7) 软件 应 具有 较 强 的 可 测试 性 ,测试 与 开发 齐头并进 。 

完整 的 Python 编码 规范 请 参考 PEP8 (http://www. python. org/dev/peps/pep- 
0008) ,在 编写 Python 程序 时 ,应 严格 遵循 以 上 约定 俗 成 的 规范 。 另 外 ,PyChecker(http:// 
pychecker, sf, net) 可 以 用 来 检查 Python 程序 中 的 错误 (bug), 并 提示 代码 中 复杂 性 和 风格 
的 不 规范 之 处 ;Pylint(http://www. logilab. org/projects/pylint) 可 以 用 来 检查 模块 是 否 符 
合 编码 规范 ,例如 检查 代码 行 长 度 、 检 查 变量 名 是 否 符合 语法 规则 、 检 查 声明 的 接口 是 否 全 
部 实现 ,等 等 。 


1.6 Python 文件 名 


在 Python 中 ,不 同 扩 展 名 的 文件 类 型 有 不 同 的 含义 和 用 途 ,常见 的 扩展 名 主要 有 以 下 
JLP. 

(1) py 一 一 Python 源 文件 ,由 Python 解释 器 负责 解释 执行 。 

(2) pyw 一 一 Python 源 文件 .常用 于 图 形 界面 程序 文件 。 

(3) pyc 一 一 Python 字 节 码 文件 ,无 法 使 用 文本 编辑 器 直接 查看 该 类 型 文件 内 容 ,可 用 
于 隐藏 Python 源 代码 和 提高 运行 速度 。 对 于 Python 模块 ,第 一 次 被 导入 时 将 被 编译 成 字 
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节 码 的 形式 ,并 在 以 后 再 次 导入 时 优先 使 用 . pyc 文件 ,以 提高 模块 的 加 载 和 运行 速度 。 对 
于 非 模块 文件 ,直接 执行 时 并 不 生成 . pyc 文件 ,但 可 以 使 用 py_compile 模块 的 compileQ PA 
数 进行 编译 以 提高 加 载 和 运行 速度 。 另 外 ,Python 还 提供 了 compileall 模块 ,其 中 包含 
compile_dir() .compile_file() 和 compile_path() 等 方法 ,用 来 支持 批量 Python 源 程序 文件 
的 编译 。 

(4) pyo 


优化 的 Python 字 节 码 文 件 ,同样 无 法 使 用 文本 编辑 器 直接 查看 其 内 容 。 
可 以 使 用 “python -O -m py_compile file. py” 或 “python -OO -m py_compile file. py” 进 行 优 
化 编译 。Python 3. 5 开始 不 再 支持 . pyo 文件 ,而 是 使 用 . pyc 文件 存储 优化 和 非 优化 代码 。 

(5) pyd 一 一 一 般 是 由 其 他 语言 编写 并 编译 的 二 进 制 文件 ,常用 于 实现 某 些 软件 工具 的 
Python 编程 接口 插件 或 Python 动态 链接 库 。 


1.7 Python 脚本 的 ”name 属性 


每 个 Python 脚本 在 运行 时 都 有 一 个 _ name _ 属 性。 如 果 脚 本 作为 模块 被 导入 , 则 其 
_ name _ 属 性 的 值 被 自动 设置 为 模块 名 ;如 果 脚 本 独立 运行 , 则 其 name _ 属 性 值 被 自 
TA" main _“。 例 如 ,假设 文件 nametest. py 中 只 包含 下 面 一 行 代码 : 


Print( name ) 
在 IDLE 中 直接 运行 该 程序 时 ,或 者 在 命令 行 提示 符 环境 中 运行 时 ,运行 结果 如 下 : 


main 


而 将 该 文件 作为 模块 导入 时 得 到 如 下 执行 结果 : 


>>> import nametest 


nametest 


利用 _ name _ 属 性 即 可 控制 Python 程序 的 运行 方式 。 例 如 ,编写 一 个 包含 大 量 函 数 
的 模块 ,而 不 希望 该 模块 可 以 直接 运行 , 则 可 以 在 程序 文件 中 添加 以 下 代码 : 
证 name ==" main_': 
print ("Please use me as a module.') 
这 样 一 来 ,程序 直接 执行 时 将 会 得 到 提示 “Please use me as a module. ”, 而 使 用 import 
语句 将 其 作为 模块 导入 后 可 以 使 用 其 中 的 类 方法、 常量 或 其 他 成 员 。 


1.8 编写 自己 的 包 * 


包 是 Python 用 来 组 织 命名 空间 和 类 的 重要 方式 ,可 以 看 作 是 包含 大 量 Python 程序 模 
块 的 文件 夹 。 在 包 的 每 个 目录 中 都 必须 包含 一 个 init _. py 文件 ,该 文件 可 以 是 一 个 空 
文件 , 仅 用 于 表示 该 目录 是 一 个 包 。 _init _. py 文件 的 主要 用 途 是 设置 all 变量 以 及 
执行 初始 化 包 所 需 的 代码 ,其 中 all ”变量 中 定义 的 对 象 可 以 在 使 用 “from…import *” 
时 全 部 被 正确 导入 。 
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假设 有 如 下 结构 的 包 : 
sound/ Top- level package 
_init .py Initialize the sound package 
formats/ Subpackage for file format conversions 
_init .py 


wavread.py 
wavwrite.py 
aiffread.py 
aiffwrite.py 
auread.py 


auwrite.py 


effects/ Subpackage for sound effects 
_ init__.py 
echo.py 
surround.py 


reverse.py 


filters/ Subpackage for filters 
init__.py 
equalizer.py 
vocoder.py 
karaoke.py 


那么 ,可 以 在 自己 的 程序 中 使 用 下 面 的 代码 导入 其 中 一 个 模块 : 
import sound.effects.echo 

然后 使 用 完整 的 名 字 来 访问 或 调用 其 中 的 成 员 ,例如 : 
sound.effects.echo.echofilter (input, output, delay=0.7, atten=4) 


或 者 参考 1. 4. 9 节 中 介绍 的 使 用 模块 成 员 的 方法 来 访问 该 模块 中 的 其 他 成 员 。 
1.9 Python 编程 快速 人 门 


在 了 解 前 面 的 Python 基础 知识 之 后 ,下 面 通过 几 个 小 程序 来 快速 了 解 如 何 使 用 
Python 解决 实际 的 问题 。 就 像 前 面 介 绍 的 一 样 , 这 几 个 例子 的 代码 是 以 脚本 程序 的 方式 给 
出 的 ,所 以 需要 在 IDLE 中 创建 一 个 程序 文件 ,然后 再 输入 这 里 的 代码 ,最 后 保存 为 扩展 名 
为 py 的 文件 并 运行 。 

例 1-1 用 户 输入 一 个 三 位 自然 数 ,计算 并 输出 其 百 位 、 十 位 和 个 位 上 的 数字 。 

这 个 例子 主要 演示 Python 中 算术 运算 符 的 用 法 ,而 计算 每 位 上 的 数字 有 多 种 方法 ,这 
里 只 给 出 其 中 一 种 ,你 能 再 想 出 几 种 ? 哪 一 种 方法 的 计算 量 最 小 ? 


x= input(" 请 输入 一 个 三 位 数 : ') 


《Python 程序 设计 (第 2 版 )》 


x= int (x) 
a=x//100 
b=x//10810 
c=x10 


print (a, b, c) 


注 : 与 大 部 分 程序 设计 教材 一 样 , 本 书 中 给 出 的 很 多 代码 一 般 都 不 是 完整 的 代码 ,只 
为 了 演示 特定 的 功能 用 法 ,而 没有 考虑 过 于 细节 的 外 围 工作 。 例 如 ,在 本 例 中 ,完整 的 程序 
还 应 该 检查 用 户 输 入 是 否 为 数字 、 是 否 为 三 位 数 等 ,可 以 使 用 “if...else...” 选 择 结构 在 计算 
之 前 进行 判断 ,也 可 以 使 用 异常 处 理 结构 来 增加 程序 的 健壮 性 和 容错 性 ,类 似 问题 后 面 不 再 

例 1-2 已 知 三 角形 的 两 边 长 及 其 夹 角 , 求 第 三 边 长 。 

这 里 需要 用 到 math 模块 中 求 平方 根 的 函数 sqrt() ,当然 这 里 给 出 的 是 比较 传统 的 写 
法 ,参考 前 面 的 知识 ,相信 你 可 以 写 出 更 加 简洁 的 代码 。 


import math 


x= input (' 输 入 两 边 长 及 夹 角 ( 度 ): ') 
a, b, theta=map (float, x.split()) # 序 列 解 包 
c=math.sqrt(a* *2+b* * 2-2% a* b* math.cos (theta * math.pi/180)) 


print ('c=', c) 


在 这 段 代 码 中 使 用 到 了 序列 解 包 的 知识 ,在 第 2 章 会 详细 讲解 ,这 里 可 以 不 必 深 究 , 用 
心 体会 Python 的 精妙 和 强大 即 可 。 

例 1-3 任意 输入 三 个 英文 单词 , 按 字典 顺序 输出 。 

本 例 中 主要 注意 变量 值 的 交换 方法 ,这 是 Python 序列 解 包 的 常用 方法 , 详 见 2.2.3 节 。 


s= input ('x,y,z="') 
X, Y, 2=s.split(',') 
if x>y: 
x, YY, x # 交 换 变量 值 
if x>z: 
Xz E 
if y>z: 
Y, 2-2, ¥ 
print (x, y, z) 


也 可 以 直接 使 用 Python PY it pA A sorted() 快 速 实 现 上 述 功能 。 


s= input ('x,y,z=") 

x, y, 2=s.split(',') # 序 列 解 包 
X, y, 2=sorted([x, y, z]) # 序 列 解 包 
print (x, y, z) 


例 1-4 Python 程序 框架 生成 器 。 
将 下 面 的 代码 保存 为 CodeFramework. py, 然 后 在 命令 提示 符 环境 中 运行 CodeFramework. py 
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newProgram. py, 即 可 以 产生 Python 程序 newProgram. py, 最 后 使 用 IDLE 打开 newProgram. py 
完善 程序 代码 。 


import os 
import sys 
import datetime 


head= '#'+ '- ' * 20+ "ne+N 
'#Function description:\n'+\ 
"ete tte 20+ '\n'+\ 
"#Ruthor: Dong Fuguo\n'+\ 
"#0Q: 306467355\n'+\ 
"#Email: dongfuguo2005¢@ 126.com\n'+\ 
nett tote 20+ '\n' 
desFile=sys.argv[1] # 目 标 文 件 名 
if os.path.exists (desFile) or not desFile.endswith('.py'): 
print ('%s already exist or is not a Python code file.!'%desFile) 
sys.exit () 
fp= open (desFile, 'w') 
today= str (datetime.date.today ()) 
fp.write('#- * - coding:utf- 8 - * -\n') 
fp.write('#Filename: '+ desFilet+ ‘\n') 
fp.write (head) 
fp.write('#Date: '+today+ '\n') 
名 .write ("#'+ '-'* 20+ '\n') 
fp.close () 


1.10 The Zen of Python ” 


最 后 请 大 家 静心 阅读 “Python 之 禅 ”, 并 不 建议 翻译 下 面 这 一 段 英文 ,这 里 也 不 打算 过 
多 地 解读 。 只 需要 用 心 去 体会 ,并 在 自己 编写 程序 的 时 候 多 想 想 这 段 话 , 努 力 让 自己 编写 的 
代码 更 加 优雅 ,更 符合 Python 的 习惯 。 


>>> import this 
The Zen of Python, by Tim Peters 


Beautiful is better than ugly. 

Explicit is better than implicit. 

Simple is better than complex. 

Complex is better than complicated. 

Flat is better than nested. 

Sparse is better than dense. 

Readability counts. 

Special cases aren't special enough to break the rules. 
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Although practicality beats purity. 

Errors should never pass silently. 

Unless explicitly silenced. 

In the face of ambiguity, refuse the temptation to guess. 

There should be one—and preferably only one—obvious way to do it. 
Although that way may not be obvious at first unless you're Dutch. 
Now is better than never. 

Although never is often better than * right * now. 

If the implementation is hard to explain, it's a bad idea. 

If the implementation is easy to explain, it may be a good idea. 
Namespaces are one honking great idea -- let's do more of those! 


AS 章 小 结 


(1) 选择 Python 版 本 时 应 首先 充分 了 解 自己 的 需求 和 可 用 的 扩展 库 情况 。 

(2) Python 2. x 和 Python 3. x 输入 输出 的 方式 略 有 不 同 ,部 分 内 置 对 象 的 实现 和 工作 
原理 也 略 有 不 同 , 对 标准 扩展 模块 的 组 织 方式 也 略 有 不 同 。 

(3) pip 已 经 成 为 Python 扩展 库 管 理 的 标准 工具 。 

(4) 在 Python 中 一 切 都 是 对 象 。 

(5) 在 Python 中 使 用 变量 时 不 需要 提前 声明 ,直接 为 变量 赋值 即 可 创建 一 个 变量 。 

(6) Python 采用 的 是 基于 值 的 内 存 管理 方式 , 当 多 个 对 象 被 赋予 相同 值 时 ,该 值 在 内 
存 中 只 有 一 个 副本 。 

(7) 编程 时 优先 考虑 使 用 内 置 函 数 来 实现 自己 的 业务 逻辑 。 

(8) 在 Python 中 ,很 多 运算 符 具有 多重 含义 。 

(9) del 命令 既 可 以 删除 一 个 变量 ,也 可 以 删除 列表 、 字 典 等 可 变 序列 中 的 部 分 元 素 。 

(10) 可 以 使 用 import 语句 来 导入 模块 中 的 对 象 , 也 可 以 为 导入 的 模块 或 对 象 设置 
别名 。 

(11) 一 般 建议 每 个 import 语句 只 导入 一 个 模块 。 

(12) dirO All helpO 〇 是 两 个 非常 有 用 的 内 置 函数 .前 者 可 以 列 出 指定 模块 或 类 中 的 对 象 
或 方法 ,后 者 可 以 查看 相应 帮助 文档 和 使 用 说 明 。 

(13) Python 程序 使 用 缩 进 来 体现 代码 之 间 的 逻辑 关系 ,并 且 建 议 使 用 必要 的 空格 、 空 
行 和 注释 来 提高 程序 的 可 读 性 。 

(14) Python 程序 中 的 注释 主要 有 两 种 形式 ， 

DO 以 # 符 号 开头 ,表示 本 行 该 符号 后 的 所 有 内 容 为 注释 ; 

© 放 在 一 对 三 引号 之 间 且 不 属于 任何 语句 的 内 容 被 认为 是 注释 。 

(15) 可 以 使 用 异常 处 理 结构 来 提高 程序 的 健壮 性 ,但 不 建议 过 多 依赖 异常 处 理 结构 。 

(16) 可 以 通过 Python 脚本 的 ”name _ 属 性 来 控制 脚本 程序 的 某 些 行为 。 

(17) Python 程序 文件 的 标准 扩展 名 为 . py, Python 也 支持 伪 编 译 将 程序 转换 为 字 
节 码 。 

(18) Python 3.5 引入 了 新 的 矩阵 运算 符 @。 
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基础 知识 


J3 wf 


1. 简单 说 明 如 何 选择 正确 的 Python 版 本 。 

2. 为 什么 说 Python 采用 的 是 基于 值 的 内 存 管理 模式 ? 

3. 解释 Python 中 的 运算 符 / 和 // 的 区 别 。 

4. 在 Python 中 导入 模块 中 的 对 象 有 哪 几 种 方式 ? 

是 目前 比较 常用 的 Python 扩展 库 管 理工 具 。 

6. 解释 Python 脚本 程序 的 _ name “变量 及 其 作用 。 

7. 运算 符 % (可 以 \ 不 可 以 ) 对 浮 点 数 进行 求 余 数 操作 。 

8. 一 个 数字 5 (是 ,不 是 ) 合 法 的 Python 表达 式 。 

9. 在 Python 2. x 中 ,inputO 〇 函数 接收 到 的 数据 类 型 由 确定 ,而 在 Python 3. x 
中 该 函数 则 认为 接收 到 的 用 户 输入 数据 一 律 为 

10. 编写 程序 ,用 户 输 入 一 个 三 位 以 上 的 整数 ,输出 其 百 位 以 上 的 数字 。 例 如 用 户 输入 
1234, 则 程序 输出 12( 提 示 : 使 用 整除 运算 )。 
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序列 是 程序 设计 中 经 常用 到 的 数据 存储 方式 ,几乎 每 一 种 程序 设计 语言 都 提供 了 类 似 
的 数据 结构 ,如 C 和 Visual Basic 中 的 一 维 、 多 维 数组 等 。 简 单 地 说 ,序列 是 一 块 用 来 存放 
多 个 值 的 连续 内 存 空间 。 一 般 而 言 , 在 实际 开发 中 同一 个 序列 中 的 元 素 通 常 是 相关 的 。 
Python 提供 的 序列 类 型 可 以 说 是 所 有 程序 设计 语言 类 似 数 据 结构 中 最 灵活 的 ,也 是 功能 最 
强大 的 。 

Python 中 常用 的 序列 结构 有 列表 、 元 组 .字典 .字符 串 、 集 合 等 。 除 字典 和 集合 属于 无 
序 序列 之 外 ,列表 ,元 组 、 字 符 串 等 序列 类 型 均 支持 双向 索引 ,第 一 个 元 素 下 标 为 0, 第 二 个 
元 素 下 标 为 1, 以 此 类 推 ;如 果 使 用 负数 作为 索引 , 则 最 后 一 个 元 素 下 标 为 -1, 倒 数 第 二 个 元 
素 下 标 为 -2, 以 此 类 推 。 可 以 使 用 负 整 数 作 为 序列 索引 是 Python 语言 的 一 大 特色 ,熟练 掌 
握 和 运用 可 以 大 幅度 提高 开发 效率 。 

大 量 经 验 表 明 ,熟练 掌握 Python 基本 数据 结构 (尤其 是 序列 ) 可 以 更 加 快速 有 效 地 解 
决 实际 问题 。 本 章 通 过 大 量 案例 介绍 了 列表 ,元 组 、 字 典 、 集 合 等 几 种 基本 数据 结构 的 用 法 ， 
同时 还 有 range 函数 的 巧妙 应 用 ,以 及 在 实际 应 用 中 非常 有 用 的 列表 推导 式 、 切 片 操作 、 
生成 器 推导 式 等 。 在 本 章 的 最 后 ,介绍 了 如 何 使 用 Python 序列 来 实现 栈 、 队 列 、 树 、 图 等 较 
为 复杂 的 数据 结构 并 模拟 其 基本 操作 。 


2.1 列 表 


列表 是 Python 的 内 置 可 变 序列 ,是 包含 若干 元 素 的 有 序 连 续 内 存 空 间 。 在 形式 上 ,列表 
的 所 有 元 素 放 在 一 对 方 括号 "[” 和 ”*]?" 中 , 相 邻 元 素 之 间 使 用 逗号 分 隔 开 。 当 列表 增加 或 删除 
元 素 时 ,列表 对 象 自动 进行 内 存 的 扩展 或 收缩 ,从 而 保证 元 素 之 间 没 有 缝 除 。Python 列表 内 
存 的 自动 管理 可 以 大 幅度 减少 程序 员 的 负担 ,但 列表 的 这 个 特点 会 涉及 列表 中 大 量 元 素 的 移 
动 , 效 率 较 低 ,并 且 对 于 某 些 操作 可 能 会 导致 意外 的 错误 结果 。 因 此 ,除非 确实 有 必要 ,否则 应 
尽量 从 列表 尾部 进行 元 素 的 增加 与 删除 操作 ,这 会 大 幅度 提高 列表 处 理 速度 。 

在 Python 中 ,同一 个 列表 中 元 素 的 类 型 可 以 不 相同 ,可 以 同时 包含 整数 、 实 数字 符 串 
等 基本 类 型 ,也 可 以 是 列表 、 元 组 字典、 集合 以 及 其 他 自 定义 类 型 的 对 象 。 例 如 : 


[10, 20, 30, 40] 

['crunchy frog', 'ram bladder', 'lark vomit'] 

['spam', 2.0, 5, [10, 20]] 

[['file1', 200,7], ['file2', 260,9]] 
都 是 合法 的 列表 对 象 。 

对 于 Python 序列 而 言 ,有 很 多 方法 是 通用 的 ,而 不 同类 型 的 序列 又 有 一 些 特 有 的 方 
法 。 列 表 对 象 常用 方法 如 表 2-1 所 示 。 除 此 之 外 ,Python 的 很 多 内 苞 函 数 和 命令 也 可 以 对 
列表 和 其 他 序列 对 象 进行 操作 ,后 面 将 通过 一 些 案例 逐步 进行 介绍 。 
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表 2-1 列表 对 象 常用 方法 


方 法 说 明 
list. append(x) 将 元 素 x 添加 至 列表 尾部 
list. extend(L) 将 列表 L 中 所 有 元 素 添加 至 列表 尾部 
list. insert(index, x) 在 列表 指定 位 置 index 处 添加 元 素 x 
list. remove(x) 在 列表 中 删除 首次 出 现 的 指定 元 素 
list. pop([index]) 删除 并 返回 列表 对 象 指 定位 置 的 元 素 , 默 认为 最 后 一 个 元 素 
list. clear) 删除 列表 中 所 有 元 素 , 但 保留 列表 对 象 ,该 方法 在 Python 2. x 中 没有 
list. index(x) 返回 第 一 个 值 为 x 的 元 素 的 下 标 , 若 不 存在 值 为 x 的 元 素 , 则 抛 出 异常 
list. count(x) 返回 指定 元 素 x 在 列表 中 的 出 现 次 数 
list. reverse() 对 列表 元 素 进行 原 地 翻转 
list. sortO 对 列表 元 素 进行 原 地 排序 
list. copyO 返回 列表 对 象 的 浅 复制 ,该 方法 在 Python 2. x 中 没有 


2.1.1 列表 创建 与 删除 


如 同 其 他 类 型 的 Python 对 象 变量 一 样 ,使 用 赋值 运算 符 “ 二 ”直接 将 一 个 列表 赋值 给 
变量 即 可 创建 列表 对 象 。 例 如 : 

>>> a_list=['a', 'b', 'mpilgrim', 'z', 'example'] 

>>> a_list= [] # 创 建 空 列表 

或 者 ,也 可 以 使 用 list() 函数 将 元 组 ,range 对象. 字符 串 或 其 他 类 型 的 可 迭代 对 象 类 型 
的 数据 转换 为 列表 。 例 如 : 


>>> a_list= list ((3,5,7,9,11)) 

>>> list (range (1,10,2)) 

[1, 3, 5, 7, 9] 

>>> list ("hello world") 

[’h’, "e", "i", "2", "ot, '*, tet, toe, Met, PA 

>>> x= List () # 创 建 空 列表 

上 面 的 代码 中 再 次 用 到 了 内 置 函 数 range() ,这 是 一 个 非常 有 用 的 函数 ,后 面 会 多 次 用 
到 ,该 函数 语法 为 


range([start,] stop[, step]) 


内 置 函 数 range() 接 收 3 个 参数 ,第 一 个 参数 表示 起 始 值 (默认 为 0) ,第 二 个 参数 表示 
终止 值 (结果 中 不 包括 这 个 值 ) ,第 三 个 参数 表示 步 长 (默认 为 1) ,该 函数 在 Python 3. x 中 
返回 一 个 range 可 迭代 对 象 , 在 Python 2.x 中 返回 一 个 包含 若干 整数 的 列表 。 另 外 ,Python 
2. x 还 提供 了 一 个 内 置 函 数 xrange() (Python 3. x 中 不 提供 该 函数 ) ,语法 与 range() 函 数 一 样 ， 
但 是 返回 xrange 可 迭代 对 象 ,类 似 于 Python 3. x 的 range() 函 数 ,其 特点 为 惰性 求 值 ,而 不 
是 像 range() 函 数 一 样 返回 列表 。 例 如 下 面 的 Python 2.7.11 代码 : 
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>>> range (10) 

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 
>>> xrange (10) 

xrange (10) 

>>> List (xrange (10) ) 

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 


使 用 Python 2. x 处 理 大 数据 或 较 大 循环 范围 时 ,建议 使 用 xrange() PR BOK HE hil AAU 
数 或 处 理 范围 ,以 获得 更 高 的 效率 。 

列表 推导 式 也 是 一 种 常用 的 快速 生成 符合 特定 要 求 列 表 的 方式 ,请 参考 2. 1. 9 节 的 内 
容 。 当 不 再 使 用 时 ,使 用 del 命令 删除 整个 列表 ,如 果 列 表 对 象 所 指向 的 值 不 再 有 其 他 对 象 
指向 ,Python 将 同时 删除 该 值 。 


>>> del a list 
>>> a_list 


NameError: name 'a_list' is not defined 


正如 上 面 的 代码 所 展示 的 一 样 ,删除 列表 对 象 a_list 之 后 ,该 对 象 就 不 存在 了 ,再 次 访 
问 时 将 抛 出 异常 NameError 提示 访问 的 对 象 名 不 存在 。 


2.1.2 列表 元 素 的 增加 


在 实际 应 用 中 ,列表 元 素 的 动态 增加 和 删除 也 是 经 常 遇 到 的 操作 ,Python 列表 提供 了 
多 种 不 同 的 方法 来 实现 这 一 功能 。 

(1) 可 以 使 用 十 运算 符 来 实现 将 元 素 添 加 到 列表 中 的 功能 。 虽 然 这 种 用 法 在 形式 上 比 
较 简单 也 容易 理解 ,但 严格 意义 上 来 讲 ,这 并 不 是 真 的 为 列表 添加 元 素 ,而 是 创建 一 个 新 列 
表 , 并 将 原 列表 中 的 元 素 和 新 元 素 依次 复制 到 新 列表 的 内 存 空 间 。 由 于 涉及 大 量 元 素 的 复 
制 , 该 操作 速度 较 慢 ,在 涉及 大 量 元 素 添加 时 不 建议 使 用 该 方法 。 

>>> aList= [3,4,5] 

>>> aList=aList+ [7] 

>>> aList 

(3, 4, 5, 7] 


(2) 使 用 列表 对 象 的 append( ) 方 法 , 原 地 修改 列表 ,是 真正 意义 上 的 在 列表 尾部 添加 元 
素 , 速 度 较 快 ,也 是 推荐 使 用 的 方法 。 


>>> aList.append (9) 
>>> alist 


(3, 4, 5, 7, 9] 
为 了 比较 十 和 append() 这 两 种 方法 的 速度 差异 ,请 看 以 下 代码 : 


import time 


result= [] 


start=time.time() 
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for i in range(10000) : 
result=result+ [i] 
print (len (result), ',', time.time()- start) 


result= [] 

start=time.time() 

for i in range (10000): 
result .append (i) 


print (len (result), ',', time.time()- start) 


在 上 面 的 代码 中 ,分 别 重复 执行 10 000 次 十 运算 和 append() 方 法 为 列表 插 人 元 素 并 比 
较 这 两 种 方法 的 运行 时 间 。 在 代码 中 ,使 用 time 模块 的 time() 函 数 返 回 当前 时 间 , 然 后 运 
行 代 码 之 后 计算 时 间 差 。 由 于 各 种 运行 时 的 原因 ,多 次 运行 上 面 的 代码 得 到 的 结果 会 有 微 
小 的 差别 ,其 中 一 次 运行 的 结果 如 下 。 可 以 看 出 ,这 两 个 方法 的 速度 相差 还 是 非常 大 的 ,使 
用 append() 方 法 比 使 用 十 运算 快 约 70 倍 。 


10000, 0.21801209449768066 
10000, 0.003000020980834961 


Python 采用 的 是 基于 值 的 自动 内 存 管理 方式 , 当 为 对 象 修改 值 时 ,并 不 是 真 的 直接 修 
改变 量 的 值 ,而 是 使 变量 指向 新 的 值 ,这 对 所 有 类 型 的 变量 都 是 一 样 的 。 例 如 : 


>>> a= [1,2,3] 
>>> id(a) 
20230752 

>>> a= [1,2] 
>>> id(a) 
20338208 


对 于 列表 、 集 合 .字典 等 可 变 序列 类 型 而 言 ,情况 稍微 复杂 一 些 。 以 列表 为 例 , 列 表 中 包 
含 的 是 元 素 值 的 引用 ,而 不 是 直接 包含 元 素 值 。 如 果 是 直接 修改 序列 变量 的 值 , 则 与 
Python 普通 变量 的 情况 是 一 样 的 ;而 如 果 是 通过 下 标 来 修改 序列 中 元 素 的 值 或 通过 可 变 序 
列 对 象 自身 提供 的 方法 来 增加 和 删除 元 素 时 ,序列 对 象 在 内 存 中 的 起 始 地 址 是 不 变 的 ,仅仅 
是 被 改变 值 的 元 素 地 址 发 生变 化 。 例 如 下 面 的 代码 所 示 ( 双 栏 排 的 代码 先 看 左 半 部 分 ,再 看 
右 半 部 分 ,后 同 ): 


>>> a= [1,2,4] 25289752 

>>> b= [1,2,3] >>> a.append (4) 
>>> a==b >>> id(a) 

False 25289752 

>>> id(a)==id(b) >>> a. remove (3) 
False >>>a 

>>> id(a[0])==id(b[0]) [1, 2, 4] 

True >>> id(a) 

>>> a= [1,2,3] 25289752 

>>> id(a) >>> a[0]=5 
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>> a >>> id (a) 
上 2, 4] 25289752 


(3) 使 用 列表 对 象 的 extend() 方 法 可 以 将 另 一 个 迭代 对 象 的 所 有 元 素 添 加 至 该 列表 对 


象 尾部 。 通 过 extend() 方 法 来 增加 列表 元 素 也 不 改变 其 内 存 首 地 址 ,属于 原 地 操作 。 例 
如 ,继续 上 面 的 代码 执行 下 面 的 代码 : 


>>> a.extend ([7,8,9]) [3 4; 5, 7; 9, 11, 131 

>>> a >>> aList.extend ( (15,17) ) 

[5, 2, 4, 7, 8, 9] >>> alist 

>>> id(a) [3, 4, 5, 7, 9, 11, 13, 15, 17] 
25289752 >>> id(a) 

>>> aList .extend ([11,13]) 25289752 

>>> aList 


(4) 使 用 列表 对 象 的 insert() 方 法 将 元 素 添 加 至 列表 的 指定 位 置 。 


>>> aList.insert (3, 6) 
>>> aList 
[3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 


列表 的 insert() 方 法 可 以 在 列表 的 任意 位 置 插 和 元素, 但 由 于 列表 的 自动 内 存 管理 功 


能 ,insert() 方 法 会 涉及 到 搬入 位 置 之 后 所 有 元 素 的 移动 ,这 会 影响 处 理 速度 ,类 似 的 还 有 后 
面 介绍 的 remove() 方 法 以 及 使 用 pop0 〇 函数 弹出 列表 非 尾 部 元 素 和 使 用 del 命令 删除 列表 
非 尾 部 元 素 的 情况 。 因 此 ,除非 必要 ,应 尽量 避免 在 列表 中 间 位 置 插入 和 删除 元 素 的 操作 ， 
而 是 优先 考虑 使 用 前 面 介 绍 的 append() 方 法 和 2.1. 3 节 介 绍 的 pop() 方 法 。 下 面 的 代码 演 
IRT insert() 方 法 和 append() 方 法 处 理 速度 的 差别 。 
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import time 


def Insert (): 
a= [] 
for i in range (10000) : 


a.insert (0, i) 


def Append () : 
a= [] 
for i in range (10000) : 


a.append (i) 


start=time.time() 
for i in range (10): 
Insert () 


print (*Insert:', time.time()- start) 
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start=time.time () 
for i in range (10): 

Append () 
print (*Append:', time.time()- start) 


运行 结果 如 下 ,可 以 看 到 这 两 个 方法 的 速度 有 很 大 差异 ,并 且 列 表 越 长 速度 相差 越 大 。 

Insert: 0.578000068665 

Append: 0.0309998989105 

(5) 使 用 乘法 来 扩展 列表 对 象 , 将 列表 与 整数 相 乘 ,生成 一 个 新 列表 ,新 列表 是 原 列表 
中 元 素 的 重复 。 


>>> aList= [3,5,7] [3, 5, 7, 3, 5, 7, 3, 5, 7] 
>>> bList=aList >>> bList 

>>> id(aList) [3,5,7] 

57091464 >>> id(aList) 

>>> id (bList) 57092680 

57091464 >>> id(bList) 

>>> aList=aList * 3 57091464 

>>> alist 


从 上 面 代码 的 运行 结果 可 以 看 出 ,该 操作 实际 上 是 创建 了 一 个 新 列表 ,而 不 是 真 的 扩展 
了 原 列 表 。 该 操作 同样 适用 于 字符 串 和 元 组 ,并 具有 相同 的 特点 。 

需要 注意 的 是 , 当 使 用 * 运算 符 将 包含 列表 的 列表 进行 重复 并 创建 新 列表 时 ,并 不 创建 
元 素 的 复制 ,而 是 创建 已 有 对 象 的 引用 。 因 此 , 当 修 改 其 中 一 个 值 时 ,相应 的 引用 也 会 被 修 
改 , 例 如 下 面 的 代码 : 


>>> x=[[None] * 2] * 3 

>>> x 

[[None, None], [None, None], [None, None]] 
>>> x[0] [0]=5 

>>> x 

[[5, None], [5, None], [5, None]] 

>>> x= [[1,2,3]] * 3 

>>> x[0] [0]=10 

>>> x 

[[10, 2, 3], [10, 2, 3], [10, 2, 3]] 


2.1.3 列表 元 素 的 删除 


(1) 使 用 del 命令 删除 列表 中 的 指定 位 置 上 的 元 素 。 前 面 已 经 提 到 过 , del 命令 也 可 以 
直接 删除 整个 列表 ,此 处 不 再 蓝 述 。 
>>> a_list=[3,5,7,9,11] 


>>> del a_list [1] 


>>> a_list 
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[3, 7, 9, 11] 


(2) 使 用 列表 的 pop() 方 法 删除 并 返回 指定 (默认 为 最 后 一 个 ) 位 置 上 的 元 素 , 如 果 给 


定 的 索引 超出 了 列表 的 范围 , 则 抛 出 异常 。 


>>>a list=1ist((3,5,7,9,11)) 
>>> a list.pop() 

11 

>>> a_list 

(3, 5, 7, 9] 

>>> a_list.pop(1) 

5 

>>> a_list 

[3, 7, 9] 


(3) 使 用 列表 对 象 的 remove() 方 法 删除 首次 出 现 的 指定 元 素 , 如 果 列 表 中 不 存在 要 删 


除 的 元 素 , 则 抛 出 异常 。 


>>> a_list= [3,5,7,9,7,11] 
>>> a_list.remove (7) 

>>> a_list 

[3, 5, 9, 7, 11] 


有 时 候 可 能 需要 删除 列表 中 指定 元 素 的 所 有 重复 ,大 家 会 很 自然 地 想到 使 用 “循环 十 


remove()” 的 方法 ,但 是 具体 操作 时 很 有 可 能 会 出 现 意 料 之 外 的 错误 ,代码 运行 没有 出 现 错 
误 , 但 结果 却 是 错 的 ,或 者 代码 不 稳定 一 一 对 某 些 数据 处 理 结 果 是 正确 的 ,而 对 某 些 数据 处 
理 结果 却 是 错误 的 。 例 如 ,下 面 的 代码 执行 结果 是 完全 正确 的 。 


>>> x= [1,2,1,2,1,2,1,2,1] 
>>> for i in x: 
if i==1: 
x.remove (i) 
>>> x 
[2, 2, 2, 2] 


然而 ,上 面 这 段 代码 的 逻辑 是 错误 的 ,尽管 执行 结果 是 正确 的 。 例 如 下 面 的 代码 ,仅仅 


是 所 处 理 的 数据 发 生 了 一 点 变化 ,然而 当 循 环 结束 后 却 发 现 并 没有 把 所 有 的 1 都 删除 ,只 是 
删除 了 一 部 分 。 


存在 
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>>> x= [1,2,1,2,1,1,1] 
>>> for i in x: 
if i==1: 
*.remove (i) 
>>> x 


[2, 2, 1] 


很 容易 看 出 ,两 组 数据 的 本 质 区 别 在 于 ,第 一 组 数据 中 没有 连续 的 1 ,而 第 二 组 数据 中 
连续 的 1。 出 现 这 个 问题 的 原因 是 列表 的 自动 内 存 管 理 功能 。 前 面 已 经 提 到 ,在 删除 
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列表 元 素 时 ,Python 会 自动 对 列表 内 存 进行 收缩 并 移动 列表 元 素 以 保证 所 有 元 素 之 间 没 有 
空隙 ,增加 列表 元 素 时 也 会 自动 扩展 内 存 并 对 元 素 进行 移动 以 保证 元 素 之 间 没 有 空 阶 。 每 
当 插入 或 删除 一 个 元 素 之 后 ,该 元 素 位 置 后 面 所 有 元 素 的 索引 就 都 改变 了 。 下 面 的 代码 很 
好 地 说 明了 这 个 问题 : 


>>> x= List (range (20) ) 
>>> x 
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19] 
>>> for i in range(len(x)): 

del x[0] 
>>> x 


0 


为 了 更 清楚 地 解释 这 个 问题 带 来 的 影响 ,对 上 面 最 开始 给 出 的 代码 进行 适当 插 桩 ,以 便 
了 解 具 体 的 执行 过 程 。 


>>> x= [1,2,1,2,1,1,1] 
>>> for i in x: 

a 

if i==1: 


x. remove (i) 


x 
1 
[2, ly 2, 1, 1, 1] x [1,2,1,2,1,1,1] 
1 i 

x 21,2111] 

(2, 2, 1, 1, 1] 4 
1 x [2.211 1] 
(2, 2, 1, 1) 4 
h x [2,2,1,1] 
[2, 2, 1] x [2,2 n 
上 面 这 段 代 码 的 执行 过 程 如 图 2-1 所 示 。 图 2-1 代码 运行 过 程 示意 图 


>>> x= [1,2,1,2,1,1,1] 
>>> for iinx[::]: 

i 

if i==1: 


x.remove (i) 


x 
1 

[2, 1, 2, 1, 1, 1] 
2 

1 

[2, 2, 1, 1, 1] 

2 

1 

[2, 2, 1, 1] 
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i 
122:3 
1 xn |e Ae ee SE A 
2, 2] t 
[ x [1,2,1,2,1,1,1] 
上 面 这 段 代码 的 执行 过 程 如 图 2-2 所 示 。 xfs 1,212,111 
4 
>>> x= [1,2,1,2,1,1,1] x [2,1,2, 1,1, 1] 
>>> for i in x[::-1]: ya Ll 
i 
TERA x [2.1,2,1,1,1] 
eee xfs 1,2,1,2,1,1, 1 
= BALLI 
1 
xi 1,2,1,2,1, 1,1 
2,1, 2,1, 1, 1) 4 
1 x 122110 
27 2 Pa PE T x ie ae 
1 { 
TEE x [2,2,1,1] 
2 xi} [,2,1,2,1,1,1 
2 x 2.2.1] 
2, 2, 1) xi] [L221 11 
2 
1 x [2,2] 
2, 2] 图 2-2 代码 执行 过 程 示意 图 


关于 切片 的 讲解 可 以 参考 2. 1. 6 节 。 另 外 ,也 可 以 
使 用 从 后 向 前 的 顺序 来 删除 列表 中 的 重复 元 素 , 例 如 下 面 的 代码 : 


>>> x= [1,2,1,2,1,1,1] 


>>> for i in range(len(x)-1,-1,-1): 


i 

if x[iJ==1: 
del x[i] 
x 


(1, 2, 1, 2, 1, 1] 


(1, 2, 1, 2, 1) 


(1, 2, 1, 2] 
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如 果 使 用 从 前 向 后 的 顺序 则 会 出 错 , 例 如 下 面 的 代码 ,具体 原因 可 以 参考 图 2-1。 


>>> x= [1,2,1,2,1,1,1] 
>>> for i in range (len (x)): 


i 


if x[i]==1: 
del x[i] 
x 

0 

(2, 1, 2, 1, 1, 1] 

1 


[2, 2, 1, 1, 1] 


[2, 2, 1, 1] 


[2, 2, 1] 


IndexError: list index out of range 


N 
= 


.4 列表 元 素 访 问 与 计数 


可 以 使 用 下 标 直 接 访问 列表 中 的 元 素 。 如 果 指 定 下 标 不 存在 , 则 抛 出 异常 提示 下 标 越 
界 , 例 如 : 


>>> aList= [3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 
>>> aList [3] 

6 
>>> aList[(3]=5.5 
>>> aList 
[3, 4, 5, 5.5, 7, 9, 11, 13, 15, 17] 
>>> aList [15] 

IndexError: list index out of range 


使 用 列表 对 象 的 index() 方 法 可 以 获取 指定 元 素 首次 出 现 的 下 标 ,语法 为 index(value， 
[start，[Lstop]]) ,其 中 start 和 stop 用 来 指定 搜索 范围 ,start 默认 为 0,stop 默认 为 列表 长 
度 。 若 列表 对 象 中 不 存在 指定 元 素 , 则 抛 出 异常 提示 列表 中 不 存在 该 值 , 例 如 : 


>>> aList 

[3, 4, 5, 5.5, 7, 9, 11, 13, 15, 17] 
>>> aList .index (7) 

4 

>>> aList .index (100) 

ValueError: 100 is not in list 


如 果 需 要 知道 指定 元 素 在 列表 中 出 现 的 次 数 ,可 以 使 用 列表 对 象 的 count() 方 法 进行 
统计 ,例如 下 面 的 代码 : 
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>>> aList 

[3, 4, 5, 5-5, 7, 9, 11, 13, 15, 17) 
>>> alist -count (7) 

1 

>>> alist .count (0) 

0 


该 方法 也 可 以 用 于 元 组 .字符 串 以 及 range 对 象 ,例如 : 


>>> range (10) .count (3) 
1 

>>> (3,3,3,4) .count (3) 

3 

>>> "abcdefgabc' .count ("abc") 


2 


2.1.5 成 员 资格 判断 


如 果 需 要 判断 列表 中 是 否 存 在 指定 的 值 ,可 以 使 用 前 面 介绍 的 count() 方 法 ;如 果 存 
在 , 则 返回 大 于 0 的 数 ; 如 果 返 回 0, 则 表示 不 存在 。 或 者 ,使 用 更 加 简洁 的 in 关键 字 来 判断 
一 个 值 是 否 存 在 于 列表 中 ,返回 结果 为 True 或 False。 


>>> aList 

[3, 4, 5, 5.5, 7, 9, 11, 13, 15, 17] 

>>> 3 in aList 

True 

>>> 18 in aList 

False 

>>> bList= [[1], [2], [3]] 

>>> 3 in bList 

False 

>>> 3 not in bList 

True 

>>> [3] in bList 

True 

>>> aList= [3, 5, 7, 9, 11] 

>>> bList= ['a', 'b', 'c', 'd'] 

>>> (3, 'a') in zip(aList, bList) 

True 

>>> for a, b in zip (aList，bList) : 
print (a, b) 

3a 

Sb 

Tec 

9d 


关键 字 in 和 not in 也 可 以 用 于 其 他 可 迭代 对 象 ,包括 元 组 .字典 range 对 象 . 字 符 串 、 
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集合 等 ,常用 在 循环 语句 中 对 序列 或 其 他 可 选 代 对 象 中 的 元 素 进行 遍历 。 使 用 这 种 方法 来 
遍历 序列 或 迭代 对 象 ,可 以 减少 代码 的 输入 量 、 简 化 程序 员 的 工作 ,并 且 大 幅度 提高 程序 的 
可 读 性 ,建议 熟练 掌握 和 运用 。 


2.1.6 切片 操作 


切片 是 Python 序列 的 重要 操作 之 一 ,适用 于 列表 ,元 组 ,字符 串 、range 对 象 等 类 型 。 
切片 使 用 2 个 冒号 分 隔 的 3 个 数字 来 完成 : 第 一 个 数字 表示 切片 开始 位 置 (默认 为 0) ,第 二 
个 数字 表示 切片 截止 (但 不 包含 ) 位 置 (默认 为 列表 长 度 ) ,第 三 个 数字 表示 切片 的 步 长 (默认 
为 1) , 当 步 长 省 略 时 可 以 顺便 省 略 最 后 一 个 冒号 。 可 以 使 用 切片 来 截取 列表 中 的 任何 部 
分 ,得 到 一 个 新 列表 ,也 可 以 通过 切片 来 修改 和 删除 列表 中 部 分 元 素 , 甚 至 可 以 通过 切片 操 
作为 列表 对 象 增加 元 素 。 

与 使 用 下 标 访问 列表 元 素 的 方法 不 同 , 切 片 操作 不 会 因为 下 标 越界 而 抛 出 异常, 而 是 简 
单 地 在 列表 尾部 截断 或 者 返回 一 个 空 列表 ,代码 具有 更 强 的 健壮 性 。 


>>> aList= [3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 
>>> aList[::] 

3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 

>>> aList[::-1] 

17, 15, 13, 11, 9, 7, 6, 5, 4, 3] 

>>> aList[::2] 

3, 5, 7, 11, 15] 

>>> aList [1::2] 

4, 6, 9, 13, 17) 

>>> aList [3::] 

6, 7, 9, 11, 13, 15, 17] 

>>> aList [3:6] 

6, 7, 9) 
>>> aList [3:6:1] 
6, 7, 9] 
>>> aList [0:100:1] 

3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 
>>> aList[100:] 

] 


可 以 使 用 切片 操作 来 快速 实现 很 多 目的 ,例如 原 地 修改 列表 内 容 , 列 表 元 素 的 增 、 删 、 
改 、 查 以 及 元 素 蔡 换 等 操作 都 可 以 通过 切片 来 实现 ,并 且 不 影响 列表 对 象 内 存 地 址 。 


>>> aList= [3, 5, 7] 

>>> aList [len (aList):] 

0] 

>>> aList [len (aList) :]= [9] 
>>> alist 

(3, 5, 7, 9] 

>>> aList[:3]=[1, 2, 3] 
>>> aList 
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[1, 2, 3, 9] 

>>> aList [:3]=[] 

>>> alist 

[9] 

>>> aList= list (range (10) ) 

>>> alist 

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 

>>> aList[::2]= [0] * (len(aList) //2) 
>>> aList 

[0, 1, 0, 3, 0, 5, 0, 7, 0, 9] 


也 可 以 结合 使 用 del 命令 与 切片 操作 来 删除 列表 中 的 部 分 元 素 。 


>>> aList= [3, 5, 7, 9, 11] 
>>> del aList[:3] 

>>> aList 

[9, 11] 


切片 返回 的 是 列表 元 素 的 浅 复 制 ,与 列表 对 象 的 直接 赋值 并 不 一 样 。 


>>> aList= [3, 5, 7] 

>>> bList=aList #bList 与 aList 指 向 同一 块 内 存 
>>> bList 

[3, 5, 7] 

>>> bList [1]=8 

>>> abist 

(3, 8, 7] 

>>> aList==bList 

True 

>>> aList is bList 

True 

>>> id(aList) # 这 里 的 输出 结果 很 可 能 和 你 的 不 一 样 ,这 是 正常 的 
19061816 

>>> id(bList) 

19061816 

>>> aList= [3, 5, 7] 

>>> bList=aList[::] # 浅 复制 
>>> aList==bList 

True 

>>> aList is bList 

False 

>>> id(aList)==id(bList) 

False 

>>> bList [1]=8 

>>> bList 

(3, 8, 7] 

>>> alist 

(3, 5, 7] 
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>>> aList==bList 
False 

>>> aList is bList 
False 

>>> id(aList) 
19061816 

>>> id (bList) 
11656168 


2.1.7 列表 排序 


在 实际 应 用 中 ,经 常 需要 对 列表 元 素 进 行 排序 ,一 个 很 自然 的 想法 就 是 使 用 列表 对 象 自 
身 提 供 的 sort() 方 法 进行 原 地 排序 ,该 方法 支持 多 种 不 同 的 排序 方式 。 


>>> aList= [3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 

>>> import random 

>>> random. shuffle (aList) # 打 乱 顺序 
>>> aList 

3, 4, 15, 11, 9, 17, 13, 6, 7, 5 
>>> aList.sort () # 默 认为 升序 排列 
>>> aList 

3, 4, 5, 6, 7, 9, 11, 13, 15, 17 
>>> aList.sort (reverse=True) # 降 序 排列 
>>> aList 

17, 15, 13, 11, 9, 7, 6, 5, 4, 3 
>>> aList.sort (key= lambda x: len (str (x))) # 自 定义 排序 
>>> aList 

9, 7, 6, 5, 4, 3, 17, 15, 13, 11 


tH FY E A A St PRC sorted() 对 列表 进行 排序 ,与 列表 对 象 的 sort OTTAA fE] > At PR 
BL sorted() 返 回 新 列表 ,并 不 对 原 列表 进行 任何 修改 。 


>>> sorted (aList) 

[3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 

>>> sorted(aList, reverse=True) # 降 序 排 列 
[17, 15, 13, 11, 9, 7, 6, 5, 4, 3] 


在 某 些 应 用 中 可 能 需要 将 列表 元 素 进行 逆序 排列 ,也 就 是 所 有 元 素 位 置 反 转 ,第 一 个 元 
素 与 最 后 一 个 元 素 交 换 位 置 , 第 二 个 元 素 与 倒数 第 二 个 元 素 交 换 位 置 , 以 此 类 推 。 可 以 使 用 
列表 对 象 的 reverse() 方 法 将 所 有 元 素 原 地 逆序 ; 


>>> import random 

>>> aList= [random.randint (50, 100) for i in range(10)] 
>>> aList 

[87, 79, 52, 96, 56, 59, 74, 80, 53, 79] 

>>> aList -reverse () 


>>> aList 
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[79, 53, 80, 74, 59, 56, 96, 52, 79, 87] 


Python 提供 了 内 置 函 数 reversed() 支 持 对 列表 元 素 进 行道 序 排 列 , 与 列表 对 象 的 
reverse() 方 法 不 同 ,内 置 函数 reversed() 不 对 原 列表 做 任何 修改 ,而 是 返回 一 个 逆序 排列 后 
的 迭代 对 象 。 例 如 : 


>>> aList=[3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 

>>> newList= reversed (aList) 

>>> newList 

<listreverseiterator object at 0x0000000003624198> 
>>> list (newList) 

[17, 15, 13, 11, 9, 7, 6, 5, 4, 3] 

>>> for i in newList: 


print (i, end=' ') 


上 面 代码 中 最 后 的 for 循环 没有 输出 任何 内 容 , 因 为 在 之 前 的 list() 函 数 执行 时 ,迭代 
对 象 已 遍历 结束 ,需要 重新 创建 迭代 对 象 才能 再 次 访问 其 内 容 。 即 : 


>>> newList= reversed (aList) 
>>> for i in newList: 

print (i, end=' ') 
17151311976543 


2.1.8 用 于 序列 操作 的 常用 内 置 函 数 


C1) emp( 序 列 1 ,序列 D: 对 两 个 列表 进行 比较 , 若 第 一 个 列表 大 于 第 二 个 , 则 结果 为 
1, 相 反 则 为 一 1 ,元 素 完全 相同 则 结果 为 0, 类 似 于 一 一、>、 一 等 关系 运算 符 , 但 和 isis not 
不 一 样 。 例 如 ， 


>>> (1, 2, 3)< (1, 2, 4) 

True 

>>> cmp((1, 2, 3), (1, 2, 4)) 
= 

>>> [1, 2, 3]<[1, 2, 4] 

True 

>>> 'ABC'< 'C'< 'Pascal'< 'Python" 
True 

>>> cmp('Pascal', 'Python') 
-1 

>>> 0, 2,3), 4)< 0,2, 4 
True 

>>> (1, 2)< (1, 2, -1) 

True 

>>> cmp((1, 2), (1, 2, -1)) 
-1 

>>> (1, 2, 3)== (1-0, 2.0, 3.0) 


True 
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>>> cmp((1, 2, 3), (1.0, 2.0, 3.0)) 

0 

>>> (1, 2, ('aa', "ab'))< (L, 2, ('abc', a"), 4) 

True 

>>> cmp('a', 'A') 

1 

>>> "a'> 'A' 

True 

在 Python 3. x 中 ,不 再 支持 cmpO R FT VA IA E A K R A ET R He BEB EL BY A 
的 大 小 。 

(2) len( 列 表 ): 返回 列表 中 的 元 素 个 数 ,同样 适用 于 元 组 字典、 集合 .字符 串 ,range 对 
象 等 各 种 可 和 迭代 对 象 。 

(3) max( 列 表 ) 、min( 列 表 ): 返回 列表 中 的 最 大 或 最 小 元 素 , 同 样 适用 于 元 组 、 字 符 
SRA range 对 象 、 字 典 等 ,要 求 所 有 元 素 之 间 可 以 进行 大 小 比较 。 另 外 ,对 字典 进行 操 
作 时 ,默认 是 对 字典 的 “ 键 ” 进 行 计算 ,如 果 需 要 对 字典 * 值 ”进行 计算 , 则 需要 使 用 字典 对 象 
的 values() 方 法 明确 说 明 。 


>>> a= {1:1, 2:5, 3:8} 
>>> max (a) 

3 

>>> max (a.values ()) 
8 


(4) sum( 列 表 ): 对 数值 型 列表 的 元 素 进行 求 和 运算 ,对 非 数 值 型 列表 运算 则 出 错 , 同 
样 适用 于 数值 型 元 组 ,集合 .range 对象 .字典 等 。 


>>> om {1:1, 2:5, 3:8} 
>>> sum(a) 

6 

>>> sum(a.values ()) 
14 


(5) zip( 列 表 1, 列 表 2,…): 将 多 个 列表 或 元 组 对 应 位 置 的 元 素 组 合 为 元 组 ,并 返回 包 
含 这 些 元 组 的 列表 (Python 2. x) ak zip 对 象 (Python 3. x) 。 例 如 ,在 Python 2.7.11 中 代码 
运行 如 下 : 

>>> aList= [1, 2, 3] 

>>> bList= [4, 5, 6] 

>>> cList= [7, 8, 9] 

>>> dList=zip(aList, bList, cList) 

>>> dList 

[(1, 4, 7), (2, 5, 8), (3, 6, 9)] 


而 在 Python 3. 5. 1 中 则 需要 这 样 使 用 : 


>>> aList= [1, 2, 3] 
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>>> bList= [4, 5, 6] 
>>> cList=zip(aList, bList) 

>>> cList 

<zip object at 0x0000000003728908> 
>>> list (cList) 

[(1, 4), (2, 5), (3, 6)] 


(6) enumerate( 列 表 ): 枚 举 列 表 、 元 组 或 其 他 可 迁 代 对 象 的 元 素 , 返 回 枚 举 对 象 , 枚 举 


对 象 中 每 个 元 素 是 包含 下 标 和 元 素 值 的 元 组 。 该 函数 对 字符 串 、 字 典 同 样 有 效 。 


>>> for item in enumerate (cList) : 
print (item) 

(0, (1, 4)) 

(1, (2, 5)) 

(2, (3, 6)) 

>>> for index, ch in enumerate ('SDIBT"): 
print ((index, ch), end=',') 

,."S 0) "DI, TG Ba. "8, 

>>>a 

tied, 26.5, SE BP 

>>> for i, v in enumerate (a): 
print (i, v) 

01 

12 

23 

>>> for i, v in enumerate (a.values ()): 
print (i, v) 

01 

15 

28 


2.1.9 列表 推导 式 


列表 推导 式 可 以 说 是 Python 程序 开发 时 应 用 最 多 的 技术 之 一 。2. 1.7 节 曾 经 使 用 列 


表 推 导 式 来 快速 生成 包含 多 个 随机 数 的 列表 ,可 以 看 出 ,列表 推导 式 使 用 非常 简洁 的 方式 来 
快速 生成 满足 特定 需求 的 列表 ,代码 具有 非常 强 的 可 读 性 。 例 如 : 


>>> aList= [xx x for x in range (10)] 


相当 于 
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>>> aList= [] 
>>> for x in range(10) : 


aList.append (xx x) 


>>> freshfruit=[' banana', ' loganberry ', 'passion fruit '] 
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>>> aList=[w.strip() for w in freshfruit] 
则 等 价 于 下 面 的 代码 ; 


>>> freshfruit=[' banana', ' loganberry ', 'passion fruit '] 
>>> for i, v in enumerate (freshfruit) : 


freshfruit [i]=v.strip() 
同时 ,也 等 价 于 


>>> freshfruit= [' banana', ' loganberry ', 'passion fruit '] 
>>> freshfruit= list (map (str.strip，freshfruit)) 


但 是 不 等 价 于 下 面 的 代码 : 


>>> freshfruit= [' banana', ' loganberry ', 'passion fruit '] 
>>> for i in freshfruit: 

isi.strip() 
接 下 来 再 通过 几 个 示例 来 进一步 展示 列表 推导 式 的 强大 功能 。 
(1) 使 用 列表 推导 式 实现 嵌 套 列表 的 平 铺 。 


>>> vec= [[1, 2, 3], [4, 5, 6]，[7，8，9]] 

>>> [num for elem in vec for num in elem] 

[1, 2, 3, 4, 5, 6, 7, 8, 9] 

(2) 过 滤 不 符合 条 件 的 元 素 。 

在 列表 推导 式 中 可 以 使 用 庄子 句 来 筛选 ,只 在 结果 列表 中 保留 符合 条 件 的 元 素 。 例 
如 ,下 面 的 代码 可 以 列 出 当前 文件 夹 下 所 有 Python 源 文件 : 


>>> import os 


>>> [filename for filename in os.listdir('.') if filename.endswith('.py')] 
而 下 面 的 代码 用 于 从 列表 中 选择 符合 条 件 的 元 素 组 成 新 的 列表 : 

>>> aList= [-1, -4, 6, 7.5, -2.3, 9, -11] 

>>> [i for i in aList if i>0] 

[6, 7.5, 9] 

再 如 ,已 知 有 一 个 包含 一 些 同学 成 绩 的 字典 ,计算 成 绩 的 最 高 分 .最 低 分 和 平均 分 ,并 查 
找 所 有 最 高 分 同学 ,代码 可 以 编写 为 如 下 : 

>>> scores= {"Zhang San": 45, "Li Si": 78, "Wang Wu": 40, "Zhou Liu": 96, "Zhao Qi": 65, "Sun 

Ba": 90, "Zheng Jiu": 78, "Wu Shi": 99, "Dong Shiyi": 60} 

>>> highest=max (scores .values ()) 

>>> lowest=min (scores.values () ) 


>>> average= sum (scores .values ()) /len (scores) 


>>> highestPerson= [name for name, score in scores.items() if score==highest] 


(3) 在 列表 推导 式 中 使 用 多 个 循环 ,实现 多 序列 元 素 的 任意 组 合 ,并 且 可 以 结合 条 件 语 
句 过 滤 特 定 元 素 。 
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>>> [(x, y) for x in range(3) for y in range(3)] 
[(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2)] 
>>> [(x, y) for x in [1, 2, 3] for y in [3, 1, 4] if x !=y] 

[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)] 


(4) 使 用 列表 推导 式 实现 矩阵 转 置 。 


>>> matrix=[[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 121] 
>>> [[row[i] for row in matrix] for i in range (4) ] 
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]] 


也 可 以 使 用 内 置 函 数 zipO All list() 来 实现 矩阵 转 置 ; 


>>> list (zip(* matrix) ) 
[(1, 5, 9), (2, 6, 10), (3, 7, 11), (4, 8, 12)] 


(5) 列表 推导 式 中 可 以 使 用 函数 或 复杂 表达 式 。 


>>> def f (v): 
if v32==0: 
v=v**2 
else: 
vevtl 
return v 
>>> print ([f (v) for v in [2, 3, 4, -1] if v>0]) 
(4, 4, 16] 
>>> print ([v**2 if v32==0 else v+1 for v in [2, 3, 4, -1] if v>0]) 
(4, 4, 16] 


(6) Fi Pete PSN SHE IC HE RT GEL 
>>> fp=open('C:\install.log', 'r') 


>>> print ([line for line in fp]) # 为 节约 篇 幅 , 这 里 没有 给 出 代码 运行 结果 


>>> fp.close () 
(7) 使 用 列表 推导 式 生成 100 以 内 的 所 有 素数 。 


>>> [p for p in range(2, 100) if 0 not in [p%d for d in range (2，int(sqrt(P))+1)]] 
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97] 


2.1.10 使 用 列表 实现 向 量 运算 * 
在 Python 中 ,列表 支持 与 整数 的 乘法 运算 ,表示 列表 元 素 进行 重复 并 生成 新 列表 ,不 
对 原 列表 进行 任何 修改 。 


I 

| 

Python 列表 不 支持 与 整数 的 加 \ 减 、 除 运算 ,也 不 支持 列表 之 间 的 减 、 乘 \ 除 操作 。 列 表 
之 间 的 加 法 运算 表示 列表 元 素 的 合并 ,生成 新 列表 ,而 不 是 向 量 意义 的 加 法 。 
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>>> [1, 2, 3] +14, 5, 6] 
[1, 2, 3, 4, 5, 6] 


然而 ,向 量 运算 经 常 涉及 这 样 的 操作 ,例如 向 量 所 有 分 量 同 时 加 、 减 , 乘 、 除 同一 个 数 ,或 
者 向 量 之 间 的 加 、 减 \ 乘 运算 ,Python 列表 对 象 本 身 不 支持 这 样 的 操作 ,不 过 可 以 借助 于 内 
置 函数 和 标准 库 operator 中 的 方法 来 实现 ,或 者 使 用 扩展 库 numpy 实现 更 加 强大 的 功能 。 
下 面 的 代码 演示 了 如 何 使 用 列表 结合 内 置 函数 和 operator 库 提供 的 方法 实现 向 量 运算 , 关 
于 numpy 的 知识 请 参考 第 17 章 。 


>>> import random 

>>>x= [random. randint (1,100) for i in range (10) ] # 生 成 10 个 [1,100] 区 间 内 的 随机 数 
>>> list (map (lambda i: i+5, x)) # 所 有 元 素 同 时 加 5 

>>>x= [random. randint (1,10) for i in range (10)] 

>>>y= [random.randint (1,10) for i in range (10)] 

>>> import operator 


>>> sum (map (operator .mul, x, y)) # 向 量 内 积 

>>>sum((i* j for i, j in zip(x, y))) # 向 量 内 积 

>>> list (map (operator.add, x, y)) # 两 个 等 长 的 向 量 对 应 元 素 相 加 
2.2 元 组 


与 列表 类 似 , 元 组 也 是 Python 的 一 个 重要 序列 结构 ,但 与 列表 不 同 的 是 ,元 组 属于 不 
可 变 序列 。 元 组 一 旦 创建 ,用 任何 方法 都 不 可 以 修改 其 元 素 的 值 ,也 无 法 为 元 组 增加 或 删除 
TERR ,如 果 确 实 需要 修改 ,只 能 再 创建 一 个 新 的 元 组 。 

元 组 的 定义 形式 和 列表 相似 ,区 别 在 于 定义 元 组 时 所 有 元 素 放 在 一 对 圆 括号 “(” 和 *)” 
中 ,而 不 是 方 括号 中 。 


2.2.1 元 组 的 创建 与 删除 

使 用 = 将 一 个 元 组 赋值 给 变量 ,就 可 以 创建 一 个 元 组 变量 。 

>>> a_tuple=('a', ) 

>>> a_tuple=('a', 'b', 'mpilgrim', 'z', 'example') 

>>> x= () # 空 元 组 

如 果 要 创建 只 包含 一 个 元 素 的 元 组 ,只 把 元 素 放 在 圆 括号 里 是 不 行 的 ,还 需要 在 元 素 后 
面 加 一 个 逗号 ”,”, 而 创建 包含 多 个 元 素 的 元 组 则 没有 这 个 限制 。 


>>> a=3 >>> a=3, 
>>>a >>>a 

3 G,) 

>>> a= (3) >>>a=1, 2 
>>> a >>> a 

3 (1, 2) 
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如 同 使 用 listO) 函数 将 序列 转换 为 列表 一 样 ,也 可 以 使 用 tuple() 函数 将 其 他 类 型 序列 
转换 为 元 组 。 

>>> print (tuple ('abcdefg')) 

Naty bt, tet, "ay tery #6. tay 

>>> aList 

(-1, -4, 6, 7.5, -2.3, 9, -11] 

>>> tuple (aList) 

(-1, -4, 6, 7.5, -2.3, 9, - 11) 

>>> s=tuple() # 空 元 组 


对 于 元 组 而 言 ,只 能 使 用 del 命令 删除 整个 元 组 对 象 ,而 不 能 只 删除 元 组 中 的 部 分 元 
素 , 因 为 元 组 属于 不 可 变 序 列 。 


2.2.2 元 组 与 列表 的 区 别 


列表 属于 可 变 序 列 , 可 以 随意 地 修改 列表 中 的 元 素 值 以 及 增加 和 删除 列表 元 素 ,而 元 组 属 
于 不 可 变 序列 ,元 组 中 的 数据 一 旦 定义 就 不 允许 通过 任何 方式 更 改 。 因 此 ,元 组 没有 提供 
append() ,extend() 和 insert() 等 方法 ,无 法 向 元 组 中 添加 元 素 ; 同 样 ,元 组 也 没有 remove() 和 
pop() 方 法 ,也 不 支持 对 元 组 元 素 进行 del 操作 ,不 能 从 元 组 中 删除 元 素 , 只 能 使 用 del 命令 删 
除 整个 元 组 。 元 组 也 支持 切片 操作 ,但 是 只 能 通过 切片 来 访问 元 组 中 的 元 素 , 而 不 支持 使 用 切 
片 来 修改 元 组 中 元 素 的 值 ,也 不 支持 使 用 切片 操作 来 为 元 组 增加 或 删除 元 素 。 

Python 内 管 函数 tuple() 可 以 接收 一 个 列表 、 字 符 串 或 其 他 序列 类 型 和 迭代 器 作为 参 
数 , 并 返回 一 个 包含 同样 元 素 的 元 组 ,而 list() 函数 可 以 接收 一 个 元 组 .字符 串 或 其 他 序列 
类 型 和 迭代 器 作为 参数 并 返回 一 个 列表 。 从 效果 上 看 ,tuple() 函 数 可 以 看 作 是 在 冻结 列表 
并 使 其 不 可 变 ,而 list() 函数 是 在 融化 元 组 使 其 可 变 。 

元 组 的 访问 和 处 理 速度 比 列 表 更 快 。 如 果 定 义 了 一 系列 常量 值 , 主 要 用 途 仅 是 对 它们 
进行 遍历 或 其 他 类 似 用 途 ,而 不 需要 对 其 元 素 进行 任何 修改 ,那么 一 般 建议 使 用 元 组 而 不 用 
列表 。 可 以 认为 元 组 对 不 需要 修改 的 数据 进行 了 “ 写 保护 ”从 内 在 实现 上 不 允许 修改 其 元 
素 值 ,从 而 使 得 代码 更 加 安全 。 

另外 ,作为 不 可 变 序列 ,与 整数 .字符 串 一 样 ,元 组 可 用 作 字 典 的 键 ,而 列表 则 永远 都 不 
能 当做 字典 键 使 用 ,因为 列表 不 是 不 可 变 的 。 

最 后 ,虽然 元 组 属于 不 可 变 序列 ,其 元 素 的 值 是 不 可 改变 的 ,但 是 如 果 元 组 中 包含 可 变 
序列 ,情况 就 略 有 不 同 ,例如 下 面 的 代码 : 


>>> x= ([1, 2], 3) 

>>> x[0] [0]=5 

>>> x 

([5, 2], 3) 

>>> x[0] -append (8) 

>>> x 

([5, 2, 8], 3) 

>>> x[0]=x[0]+ [10] 

TypeError: 'tuple' object does not support item assignment 
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>>> x 
([5, 2, 8], 3) 


2.2.3 序列 解 包 


在 实际 开发 中 ,序列 解 包 是 非常 重要 和 常用 的 一 个 用 法 ,可 以 使 用 非常 简洁 的 形式 完成 
复杂 的 功能 ,大 幅度 提高 了 代码 的 可 读 性 ,并 且 减 少 了 程序 员 的 代码 输入 量 。 例 如 ,可 以 使 
用 序列 解 包 功能 对 多 个 变量 同时 进行 赋值 : 

>>> x, y, 2=1, 2, 3 

>>> print (x, y, Z) 

123 


再 如 


>>> v_tuple= (False, 3.5, 'exp') 
>>> (x, y, z)=v_tuple 


或 者 

>>> x, yY, z=v_tuple 

序列 解 包 也 可 以 用 于 列表 和 字典 ,但 是 对 字典 使 用 时 ,默认 是 对 字典 * 键 "操作 ,如 果 需 
要 对 “ 键 - 值 对 ”操作 ,需要 使 用 字典 的 items() 方 法 说 明 ,如 果 需 要 对 字典 * 值 ?操作 , 则 需要 
使 用 字典 的 values() 方 法 明确 指定 。 对 字典 操作 时 ,不 需要 对 元 素 的 顺序 考虑 过 多 。 下 面 
的 代码 演示 了 列表 与 字典 的 序列 解 包 操作 : 


>>> a= [1, 2, 3] >>>b, c, d=s 

>>>b, c, d=a >>>b 

>>> s= {'a':1, 'b':2, 'c':3} 'c' 

>>>b, c, d=s.items() >>> b, c, d=s.values() 
>>>b >>> print (b, c, d) 
('c', 3) 132 


使 用 序列 解 包 可 以 很 方便 地 同时 遍历 多 个 序列 。 


>>> keys= ['a', 'b', 'c', 'd'] 

>>> values= [1, 2, 3, 4] 

>>> for k, v in zip(keys, values): 
print (k, v) 

al 

b2 

c3 

d4 


在 调用 函数 时 ,在 实 参 前 面 加 上 一 个 星 号 (* ) 也 可 以 进行 序列 解 包 ,从 而 实现 将 序列 中 
的 元 素 值 依次 传递 给 相同 数量 的 形 参 , 详 见 5. 3. 4 节 的 讨论 。 
在 Python 3.5 中 ,序列 解 包 还 支持 下 面 代码 演示 的 用 法 ,请 结合 第 5 章 内 容 理解 。 
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>>>print (* [1], *[2], 3, *[4, 5]) 
12345 
>>> def demo (a, b, c, d): 

print (a, b, c, d) 
>>>demo(**{'a': 1, 'c': 3}, **{"b': 2, 'd': 4}) # 调 用 函数 时 参数 序列 解 包 
123.4 
>>>*range (4), 4 
(0, 1, 2, 3, 4) 
>>> [*range (4), 4] 
[0, 1, 2, 3, 4] 
>>> {*range(4), 4, * (5, 6, 7)} 
{0, 1, 2, 3, 4, 5, 6, 7} 
FP 
人 


2.2.4 生成 器 推导 式 


从 形式 上 看 ,生成 器 推导 式 与 列表 推导 式 非常 接近 ,只 是 生成 器 推导 式 使 用 圆 括号 
而 不 是 列表 推导 式 所 使 用 的 方 括号 。 与 列表 推导 式 不 同 的 是 ,生成 器 推导 式 的 结果 是 一 
个 生成 器 对 象 ,而 不 是 列表 ,也 不 是 元 组 。 使 用 生成 器 对 象 的 元 素 时 ,可 以 根据 需要 将 其 
转化 为 列表 或 元 组 ,也 可 以 使 用 生成 器 对 象 的 next() 方 法 (Python 2. x) Be next OW 
法 (Python 3. x) 进 行 遍历 ,或 者 直接 将 其 作为 迭代 器 对 象 来 使 用 。 但 是 不 管用 哪 种 方法 
访问 其 元 素 , 当 所 有 元 素 访问 结束 以 后 ,如 果 需 要 重新 访问 其 中 的 元 素 ,必须 重新 创建 该 
生成 器 对 象 。 


>>> g= ((i+ 2)**2 for i in range(10)) 
>>> 9 
<generator object< genexpr>at 0x02B15Cc60> 
>>> tuple (g) # 转 化 为 元 组 
(4, 9, 16, 25, 36, 49, 64, 81, 100, 121) 
>>> tuple (g) # 元 素 已 经 遍历 结束 
0 
>>> g= ((i+2)**2 for i in range(10)) ”# 重 新 创建 生成 器 对 象 
>>> list (g) # 转 化 为 列表 
[4, 9, 16, 25, 36, 49, 64, 81, 100, 121] 
>>> g= ((i+2)**2 for i in range(10)) 
>>> g-next () AH EI, TE Python 3.x PMMA next () 
4 
>>> g.next () 
9 
>>> g-next () 
16 
>>> g= ((i+2)**2 for i in range(10)) 
>>> for i ing: FH AMIEL 
print i, +E Python 3.x 中 应 写 为 print (i, end="") 
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49162536496481 100 121 


23 字 H 


字典 是 “ 键 - 值 对 ?的 无 序 可 变 序 列 , 字 典 中 的 每 个 元 素 包 含 两 部 分 :“ 键 ?和 "* 值 >。 定义 
字典 时 ,每 个 元 素 的 “ 键 " 和 * 值 "用 骨 号 分 隔 , 相 邻 元 素 之 间 用 逗号 分 隔 ,所 有 的 元 素 放 在 一 
对 大 括号 “{” 和 “}” 中 。 

字典 中 的 “ 键 ”" 可 以 是 Python 中 任意 不 可 变数 据 ,例如 整数 .实数 、 复 数 、 字 符 串 、 元 组 
等 ,但 不 能 使 用 列表 、 集 合 、 字 典 作为 字典 的 “ 键 ”, 因 为 这 些 类 型 的 对 象 是 可 变 的 。 男 外 , 字 
典 中 的 “ 键 " 不 允许 重复 ,而 “ 值 ” 是 可 以 重复 的 。 

可 以 使 用 内 置 函数 globals() 返 回 和 查看 包含 当前 作用 域内 所 有 全 局 变量 和 值 的 字典 ， 
使 用 内 置 函数 locals() 返 回 包含 当前 作用 域内 所 有 局 部 变量 和 值 的 字典 。 


>>> a= (1, 2, 3, 4, 5) # 全 局 变量 
>>> b= 'Hello world." # 全 局 变量 
>>> def demo () : 
a=3 # 局 部 变量 
b=[1, 2, 3] # 局 部 变量 


print ('locals:', locals()) 
print ('globals:', globals()) 
>>> demo () 
locals: {'a': 3, 'b': [1, 2, 3]} 
globals: {'a': (1, 2, 3, 4, 5), 'b': 'Helloworld.', '_ builtins __':<module 
'_ builtin _' (built-in)>, "demo':< function demo at 0x013907F0>, '"__package__': None, '_ name 


': "main ', '_doc__': None} 


2.3.1 字典 创建 与 删除 
使 用 王将 一 个 字典 赋值 给 一 个 变量 即 可 创建 一 个 字典 变量 。 


>>> a_dict={'server': 'db.diveintopython3.org', 'database': 'mysql'} 
>>> a_dict 


{'database': 'mysql', 'server': 'db.diveintopython3.org"} 
WY OE FP EE PRC dict() 通 过 已 有 数据 快速 创建 字典 : 


>>> keys=['a', 'b', 'c', 'd'] 

>>> values=[1, 2, 3, 4] 

>>> dictionary=dict (zip(keys, values) ) 
>>> print (dictionary) 

{'a': 1, 'c': 3, 'b': 2, 'd': 4} 


>>> x= dict () # 空 字典 
>>> x= {} # 空 字典 


或 者 使 用 内 置 函数 dictO) 根 据 给 定 的 “ 键 - 值 对 ”来 创建 字典 : 
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>>> d=dict (name= 'Dong', age=37) 
>>> d 


{'age': 37, 'name': 'Dong'} 
还 可 以 以 给 定 内 容 为 “ 键 ”, 创 建 “ 值 ”为 空 的 字典 : 
>>> adict=dict.fromkeys(['name', 'age', 'sex']) 


>>> adict 


{"age': None, 'name': None, 'sex': None} 


当 不 再 需要 某 个 字典 时 ,可 以 使 用 del 命令 删除 整个 字典 ,也 可 以 使 用 del 命令 删除 字 
典 中 指定 的 元 素 , 请 参考 2. 3. 3 节 的 内 容 。 


2.3.2 字典 元 素 的 读 取 


与 列表 和 元 组 类 似 , 可 以 使 用 下 标的 方式 来 访问 字典 中 的 元 素 ,但 不 同 的 是 字典 的 下 标 
是 字典 的 “ 键 ”, 而 列表 和 元 组 访问 时 下 标 必须 为 整数 值 。 使 用 下 标的 方式 访问 字典 “ 值 ” 时 ， 
若 指定 的 * 键 ?不 存在 则 抛 出 异常 。 


>>> aDict={'name':'Dong', 'sex':'male', 'age':37} 
>>> aDict ['name'] 

"Dong" 

>>> aDict['tel"] 

KeyError: 'tel' 


比较 推荐 的 也 是 更 加 安全 的 字典 元 素 访问 方式 是 字典 对 象 的 get() 方 法 。 使 用 字典 对 
象 的 get() 方 法 可 以 获取 指定 * 键 ?对 应 的 “ 值 ”并且 可 以 在 指定 * 键 "不 存在 的 时 候 返回 指 
定 值 ,如 果 不 指定 , 则 默认 返回 None。 


>>> print (aDict.get ("address')) 

None 

>>> print (aDict.get ("address', 'SDIBT')) 
SDIBT 

>>> aDict['score']=aDict.get('score', []) 
>>> aDict ['score"] .append (98) 

>>> aDict ['score"'] .append (97) 

>>> aDict 


{'age': 37, 'score': [98, 97], 'name': 'Dong', 'sex': 'male'} 

另外 ,使 用 字典 对 象 的 items() 方 法 可 以 返回 字典 的 “ 键 - 值 对 ”列表 ,使 用 字典 对 象 的 
keys() 方 法 可 以 返回 字典 的 “ 键 " 列 表 , 使 用 字典 对 象 的 values() 方 法 可 以 返回 字典 的 “ 值 ” 
列表 。 


>>> aDict={'name':'Dong', 'sex':'male', 'age':37} 
>>> for item in aDict.items () : 

print (item) 
('age', 37) 


('name', 'Dong') 
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('sex', 'male') 

>>> for key in aDict: 
print (key) 

age 

name 

sex 

>>> for key, value in aDict.items(): 
print (key, value) 

age 37 

name Dong 


sex male 


2.3.3 字典 元 素 的 添加 与 修改 


当 以 指定 “ 键 "为 下 标 为 字典 元 素 赋值 时 ,车 该 “ 键 " 存 在 , 则 表示 修改 该 * 键 "的 值 ; 若 不 
存在 , 则 表示 添加 一 个 新 的 “ 键 - 值 对 ”, 也 就 是 添加 一 个 新 元 素 。 

>>> aDict['age']=38 

>>> aDict 

{'age': 38, 'name': 'Dong', 'sex': 'male'} 

>>> aDict ['address']= 'SDIBT' 

>>> aDict 

{'age': 38, 'address': 'SDIBT', 'name': 'Dong', 'sex': 'male'} 

使 用 字典 对 象 的 update() 方 法 将 另 一 个 字典 的 * 键 - 值 对 "一 次 性 全 部 添加 到 当前 字典 
对 象 ,如 果 两 个 字典 中 存在 相同 的 “ 键 ”, 则 以 另 一 个 字典 中 的 “ 值 ”为 准 对 当前 字典 进行 
更 新 。 

>>> aDict.update({'a':'a', 'b':'b'}) 

>>> aDict 

{'a': 'a', 'score': [98, 97], 'name': "Dong' ‘age': 37, b's 'b', 'sex': 'male'} 

当 需 要 删除 字典 元 素 时 ,可 以 根据 具体 要 求 使 用 del 命令 删除 字典 中 指定 “ 键 "对 应 的 
元 素 ,或 者 也 可 以 使 用 字典 对 象 的 clear() 方 法 来 删除 字典 中 所 有 元 素 , 还 可 以 使 用 字典 对 
象 的 pop() 方 法 删除 并 返回 指定 * 键 ”的 元 素 ,或 者 使 用 字典 对 象 的 popitem() 方 法 删除 并 返 
回 字典 中 的 一 个 元 素 , 大 家 可 以 自行 练习 这 些 用 法 。 


2.3.4 字典 应 用 案例 
下 面 的 代码 首先 生成 包含 1000 个 随机 字符 的 字符 串 ,然后 统计 每 个 字符 的 出 现 次 数 。 


>>> import string 

>>> import random 

>>> x= string.ascii_letters+ string.digits+ string.punctuation 

>>> x 

‘abcde fghi jklmnopgrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWKYZ0123456789!"#$ S6\"() * +,- ./:;<=>? 
BANE ie 
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>>> y= [random.choice(x) for i in range (1000) ] 
>>> z="" join (y) 

>>> d=dict () 

>>> for ch in z: 


d[ch]=d.get (ch, 0)+1 


也 可 以 使 用 collections 模块 的 defaultdict 类 来 实现 该 功能 。 


>>> import string 
>>> import random 
>>> x= string.ascii_letters+ string.digits+ string.punctuation 
>>> y= [random.choice(x) for i in range (1000) ] 
>>> z=''.join(y) 
>>> from collections import defaultdict 
>>> frequences=defaultdict (int) 
>>> frequences 
defaultdict (<type 'int'>, {}) 
>>> for item in z: 
frequences [item]+=1 


>>> frequences.items () 


使 用 collections 模块 的 Counter 类 可 以 快速 实现 这 个 功能 ,并 且 能 够 满足 其 他 需要 , 例 
如 查找 出 现 次 数 最 多 的 元 素 。 下 面 的 代码 演示 了 Counter 类 的 用 法 : 


>>> from collections import Counter 
>>> frequences= Counter (z) 

>>> frequences. items () 

>>> frequences.most_common (1) 
[('A', 22)] 

>>> frequences.most_common (3) 
[('A', 22), ("7', 18), ('*', 17)] 


类 似 于 列表 推导 式 ,Python 也 支持 字典 推导 式 快速 生成 符合 特定 条 件 的 字典 。 


>>> {i:str (i) for i in range(1, 5)} 
人 


>>> x= ['A', "BY, 'C', 'D'] 
>>> y= ['a', 'b', rb', 'd'] 

>>> {i:j for i,j in zip(x,y)} 

(A's 'a', 'C': 'b', 'B': "bt, 'D': 'd'} 


2.3.5 有 序 字 典 ” 


Python 内 置 字典 是 无 序 的 ,前 面 的 示例 很 好 地 说 明了 这 个 问题 。 如 果 需 要 一 个 可 以 记 住 元 
素 插入 顺序 的 字典 ,可 以 使 用 collections. OrderedDict。 在 Python 3. 5 中 ,collections. OrderedDict 
使 用 C 语言 实现 运行 速度 提高 4 一 100 FFF. 


>>> import collections 
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>>> x=collections.OrderedDict () # 有 序 字典 
>>> x['a']=3 

>>> x['b']=5 

>>> x['c']=8 

>>>x 


OrderedDict ([('a', 3), ("b', 5), ('c', 8)]) 


2.4 46 合 


集合 是 无 序 可 变 序列 ,与 字典 一 样 使 用 一 对 大 括号 作为 界定 符 , 同 一 个 集合 的 元 素 之 间 
不 允许 重复 ,集合 中 每 个 元 素 都 是 唯一 的 。 


2.4.1 集合 的 创建 与 删除 


正如 前 面 多 次 提 到 的 ,在 Python 中 变量 不 需要 提前 声明 其 类 型 ,直接 将 集合 赋值 给 变 
量 即 可 创建 一 个 集合 对 象 。 


>>> a= {3, 5} 
>>> a.add(7) 
>>>a 

{3, 5, 7} 


tT E set ©) PR BORG FU Ze. 7c 2 EH {tb a ERA Be a SE EN A HG EC FP 
存在 重复 元 素 , 则 在 转换 为 集合 的 时 候 只 保留 一 个 。 


>>> a_set= set (range (8, 14)) 

>>> a_set 

{8, 9, 10, 11, 12, 13} 

>>> b_set=set([0, 1, 2, 3, 0, 1, 2, 3, 7, 8]) 
>>> b_set 

{0, 1, 2, 3, 7, 8} 

>>> x= set () # 空 集合 


可 以 使 用 集合 对 象 的 add() 方 法 增加 元 素 。 当 不 再 使 用 某 个 集合 时 ,可 以 使 用 del 命令 
删除 整个 集合 。 另 外 ,也 可 以 使 用 集合 对 象 的 pop() 方 法 弹出 并 删除 其 中 一 个 元 素 ,或 者 使 
用 集合 对 象 的 remove() 方 法 直接 删除 指定 元 素 , 以 及 使 用 集合 对 象 的 clear() 方 法 清空 集合 
删除 所 有 元 素 。 


>>> a= {1, 4, 2, 3} 
>>> a.pop() 

1 

>>>a 

{2, 3, 4} 

>>> a-pop () 

2 


>>>a 
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{3, 4} 

>>> a.add (2) 

>>> a 

{2, 3, 4} 

>>> a.remove (3) # 删 除 指定 元 素 

>>> 已 

{2, 4} 

>>> a.pop (2) #pop() 方 法 不 接收 参数 
TypeError: pop() takes no arguments (1 given) 


2.4.2 集合 操作 


Python 集合 支持 交集 、 并 集 、 差 集 等 运算 ,大 家 结合 在 其 他 课程 里 学 过 的 集合 知识 ,应 


该 不 难 理解 下 面 的 代码 : 
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>>> a_set=set([8, 9, 10, 11, 12, 13]) 
>>> b_set=set([0, 1, 2, 3, 7, 8]) 


>>> a_set | b set # 并 集 
{0, 1, 2, 3, 7, 8, 9, 10, 11, 12, 13} 

>>> a_set.union (b_set) # 并 集 
{0, 1, 2, 3, 7, 8, 9, 10, 11, 12, 13} 

>>> a_set &b set # 交 集 
{8} 

>>> a_set.intersection(b set) # 交 集 
{8} 

>>> a_set.difference (b_set) # 差 集 


{9, 10, 11, 12, 13} 

>>> a_set-b_set 

{9, 10, 11, 12, 13} 

>>> a_set.symmetric difference (b_set) # 对 称 差 

{0, 1, 2, 3, 7, 9, 10, 11, 12, 13} 

>>> a_set ^b set 

{0, 1, 2, 3, 7, 9, 10, 11, 12, 13} 

>>> x= {1, 2, 3} 

>>> y= {1, 2, 5} 

>>> z= {1, 2, 3, 4} 

>>> x<y # 比 较 集合 大 小 
False 

>>> x<z 

True 

>>> y<z 

False 

>>> x. issubset (y) # 测 试 是 否 为 子 集 
False 

>>> x.issubset (z) 


True 
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作为 集合 的 具体 应 用 ,可 以 使 用 集合 快速 提取 序列 中 单一 元 素 , 即 提取 出 序列 中 所 有 不 
ERIR ,如 果 使 用 传统 方式 , 则 需要 编写 下 面 的 代码 : 


EN 


>>> from random import randint 
>>> listRandom= [randint (0, 9999) for i in range (100) ] 
#100 AAF 0~ 9999 之 间 的 随机 数 
>>> noRepeat= [] 
>>> for i in listRandom : 
if i not in noRepeat : 
noRepeat . append (i) 
>>> len (listRandom) 
>>> len (noRepeat) 


如 果 使 用 集合 ,只 需要 如 下 一 行 代码 就 可 以 了 。 


>>> newSet= set (listRandom) 


2.4.3 集合 运用 案例 


Python 集合 的 内 部 实现 保证 了 元 素 不 重复 ,并 做 了 大 量 优化 。 下 面 代码 使 用 3 种 方法 
生成 不 重复 的 随机 数 , 大 量 实验 数据 表明 ,使 用 集合 可 以 获得 最 高 的 执行 效率 。 
例 2-1 生成 不 重复 随机 数 的 效率 比较 。 


import random 
import time 


def RandomNumbers (number, start, end): 
"使 用 列表 来 生成 number 个 介 于 start 和 end 之 间 的 不 重复 随机 数 " 
data= [] 
n=0 
while True: 
element= random. randint (start, end) 
if element not in data: 
data.append (element) 
n+=1 
if n ==number: 
break 
return data 


def RandomNumbers1 (number, start, end) : 

”使 用 列表 来 生成 number 个 介 于 start 和 end 之 间 的 不 重复 随机 数 " 
data= [] 
while True: 

element= random.randint (start, end) 

if element not in data: 

data.append (element) 
if len (data) ==nunber: 
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break 
return data 


def RandomNumbers2 (number, start, end): 
"使 用 集合 来 生成 number 个 介 于 start 和 end 之 间 的 不 重复 随机 数 " 
data= set () 
while True: 
data.add (random. randint (start, end)) 
if len (data) ==number: 
break 


return data 


start=time.time() 

for i in range (10000) : 
RandomNumbers (50, 1, 100) 

print ('Time used:', time.time()- start) 


(另外 2 个 函数 的 测试 代码 见 配 套 源 代码 ,或 根据 上 面 的 代码 自行 编写 ) 
改变 函数 参数 ,增加 不 重复 数 的 个 数 要 求 会 发 现 ,序列 越 长 ,使 用 集合 的 效率 越 高 。 


最 后 ,除了 前 面 介绍 的 列表 推导 式 、 生 成 器 推导 式 、 字 典 推导 式 , Python 也 支持 集合 推 
导 式 。 


>>> {x.strip() for x in ('he', 'she ', ' I')} 

{'I', 'she', 'he'} 

>>> import random 

>>>x= {random.randint (1,500) for i in range (100) } # 生 成 随机 数 ,自动 去 除 重复 元 素 
>>> Len (x) # 一 般 而 言 输出 结果 会 小 于 100 


2.5 和 再 谈 内 置 方法 sorted() 


前 面 已 经 介绍 过 ,列表 对 象 提供 了 sort() 方 法 支持 原 地 排序 ,而 内 力 函 数 sorted() 返 回 


新 的 列表 ,并 不 对 原 列表 做 任何 修改 。 除 此 之 外 ,sorted() 方 法 还 可 以 对 元 组 .字典 排序 ,并 
且 借 助 于 其 key 和 cmp 参数 (Python 3. x 的 sorted() 方 法 没有 cmp 参数 ) 可 以 实现 更 加 复 
杂 的 排序 。 需 要 注意 的 是 ,Python 2. x 中 内 置 方法 sorted() 的 cmp 参数 会 被 处 理 多 次 ,而 
key 参数 只 会 被 处 理 一 次 ,具有 更 高 的 速度 。 
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>>> persons=[{'name':'Dong', 'age':37}, {'name':"Zhang', 'age':40}, {'name':'Li', 'age':50}, 
{'name':'Dong', 'age':43}] 

>>> print (persons) 

[{'age': 37, 'name': 'Dong'}, {"age': 40, 'name': 'Zhang'}, {"age': 50, 'name': 'Li'}, {"age':43, ' 
name": "Dong'}] 

HEJH key 来 指定 排序 依据 , 先 按 姓名 升序 排序 ,姓名 相同 的 按 年 龄 降序 排序 

>>> print (sorted (persons, key= lambda x: (x['name'], —x["age"]))) 


[{'age': 43, 'name': 'Dong'}, {"age': 37, 'name': 'Dong'}, {'age': 50, 'name': 'Li'}, 


{"age': 40, 'name': 'Zhang"}] 

>>> from timeit import Timer 

# 在 Python 2.7.11 中 比较 sorted() 方 法 的 key 参 数 与 cmp 参 数 对 排序 速度 的 影响 

>>> Timer (stmt= 'sorted (xs, key= lambda x: x[1])', setup= 'xs=range (100); xs=zip(xs, xs); '). 
timeit (100000) 

1.930681312803035 

>>> Timer (stmt= 'sorted(xs, cmp= lambda a, b: cmp(a[1], b[1]))', setup= 'xs= range (100) ;xs= zip 
(xs, xs); ') .timeit (100000) 

3.0562786705272416 

>>> phonebook= {'Linda':'7750', 'Bob':'9345', 'Carol':'5834"} 

>>> from operator import itemgetter 


>>> sorted (phonebook. items(), key=itemgetter (1) ) # 按 字典 中 元 素 值 排序 
('Carol', '5834'), ("Linda', '7750"), ("Bob', '9345')] 
>>> sorted (phonebook. items (), key=itemgetter (0)) # 按 字典 中 元 素 的 键 排序 


("Bob', '9345'), ("Carol', '5834"'), ('Linda', '7750')] 

>>> gameresult= [['Bob', 95.0, 'A'], ['Alan', 86.0, 'C'], ['Mandy', 83.5, 'A'], 
"Rob', 89.3, 'E']] 

>>> sorted (gameresult, key=itemgetter (0, 1)) # 按 姓名 升序 ,姓名 相同 按 分 数 升 序 排序 
['Alan', 86.0, 'C'], ["Bob', 95.0, 'A'], ["Mandy', 83.5, 'A'], ["Rob', 89.3, 'E']] 


>>> sorted (gameresult, key-itemgetter(1, 0)) # 按 分 数 升 序 , 分 数 相 同 的 按 姓名 升序 排序 
["Mandy', 83.5, 'A'], ['Alan', 86.0, 'C'], ["Rob', 89.3, 'E'], ["Bob', 95.0, 'A']] 
>>> sorted (gameresult, key=itemgetter (2, 0)) # 按 等 级 升序 ,等 级 相同 的 按 姓名 升序 排序 


['Bob', 95.0, 'A'], ["Mandy', 83.5, 'A'], ['Alan', 86.0, 'C'], ['Rob', 89.3, 'E']] 
>>> gameresult= [{'name':'Bob', 'wins':10, 'losses':3, 'rating':75.0}, 
{'name':'David', 'wins':3, 'losses':5, 'rating':57.0}, 
{'name':'Carol', 'wins':4, 'losses':5, 'rating':57.0}, 
{'name':'Patty', 'wins':9, 'losses':3, 'rating':72.8}] 
>>> sorted(gameresult, key=itemgetter('wins', 'name')) 
# 按 "wins' 升 序 , 该 值 相同 的 按 name Ft FF HEE 
[{ "wins': 3, 'rating': 57.0, 'name': 'David', 'losses': 5}, {"wins': 4, 'rating': 57.0, 'name': ' 
Carol', 'losses': 5}, {'wins': 9, 'rating': 72.8, 'name': 'Patty', 'losses': 3}, {'wins': 10, ' 
rating’: 75.0, 'name': 'Bob', 'losses': 3}] 
# 以 下 代码 演示 如 何 根据 另外 一 个 列表 的 值 来 对 当前 列表 元 素 排序 
>>> listl= ["what", "I'm", "sorting", "by"] 
>>> list2=["something", "else", "to", "sort"] 
>>> pairs=zip(listl, list2) 
>>> pairs= sorted (pairs) 
>>> pairs 
[("I'm", 'else'), ('by', "sort'), ('sorting', 'to"), ("what', 'something')] 
>>> result= [x[1] for x in pairs] 
>>> result 


['else', 'sort', 'to', 'something'] 
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2.6 复杂 数据 结构 * 


在 应 用 开发 中 ,除了 Python 序列 等 基本 数据 类 型 之 外 ,还 经 常 需要 使 用 到 其 他 一 些 数 
据 结构 ,例如 堆 、 栈 、 队 列 、 树 、 图 等 等 。 其 中 有 些 结构 Python 本 身 已 经 提供 了 ,而 有 些 则 需 
要 自己 利用 Python 基本 序列 或 其 他 数据 类 型 来 实现 。 本 节 内 容 可 以 看 作 是 Python 序列 、 
元 组 等 基本 数据 结构 的 扩展 ,或 者 Python 基本 数据 结构 的 二 次 开发 。 


2.6.1 HE 


堆 是 一 种 重要 的 数据 结构 ,在 进行 排序 时 使 用 较 多 ,优先 队列 也 是 堆 结构 的 一 个 重要 应 
用 。 堆 是 一 个 二 又 树 ,其 中 每 个 父 节点 的 值 都 小 于 或 等 于 其 所 有 子 节点 的 值 。 使 用 数组 或 列 
表 来 实现 堆 时 ,对 于 所 有 的 k( 下 标 ,从 0 开始) 都 满足 heap[k]<=heap[2 *k 十 1] 和 heap[kj<= 
heapL2 * kk 十 2], 并 且 整 个 堆 中 最 小 的 元 素 总 是 位 于 二 叉 树 的 根 节点 。Python 在 heapq 模块 中 
提供 了 对 堆 的 支持 。 下 面 的 代码 演示 了 堆 的 原理 以 及 heapq 模块 的 用 法 ,同时 也 请 注意 
random 模块 的 用 法 。 另 外 , 当 堆 中 没有 元 素 时 ,进行 heappop() 操 作 将 会 抛 出 异常 。 


>>> import heapq 

>>> import random 

>>> data= list (range (10) ) 

>>> random. shuffle (data) # 随 机 打 乱 列表 中 元 素 的 顺序 

>>> data 

[6, 1, 3, 4, 9, 0, 5, 2, 8, 7] 

>>> heap= [] 

>>> for n in data: # 建 堆 
heapq.heappush (heap, n) 

>>> heap 

[0, 2, 1, 4, 7, 3, 5, 6, 8, 9] 

>>> heapq.heappush (heap, 0.5) # 新 数据 入 堆 

>>> heap 

[0, 0.5, 1, 4, 2, 3, 5, 6, 8, 9, 7] 

>>> heapq.heappop (heap) # 弹 出 最 小 的 元 素 , 堆 会 自动 重建 

0 

>>> heapq.heappop (heap) 

0.5 

>>> heapq.heappop (heap) 

a 

>>> myheap= [1, 2, 3, 5, 7, 8, 9, 4, 10, 333] 


>>> heapq.heapi fy (myheap) # 将 列表 转化 为 堆 

>>> myheap 

[1, 2, 3, 4, 7, 8, 9, 5, 10, 333] 

>>> heapq.heapreplace (myheap, 6) # 替 换 堆 中 的 元 素 值 ,自动 重新 构建 堆 
1 

>>> myheap 
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(2, 4, 3, 5, 7, 8, 9, 6, 10, 333] 
>>> heapg-nlargest (3, myheap) 
[333, 10, 9] 

>>> heapgq-nsmallest (3, myheap) 
[2, 3, 4] 


2.6.2 队列 


Python 序列 


# 返 回 前 3 个 最 大 的 元 素 


# 返 回 前 3 个 最 小 的 元 素 


队列 的 特点 是 “先进 先 出 (First In First Out, FIFO)” 和 “后 进 后 出 (Last In Last Out, 
LILO)”, 在 某 些 应 用 中 有 着 重要 的 作用 ,例如 多 线程 编程 .作业 处 理 等 。Python 提供 了 
Queue 模块 (在 Python 3. x 中 为 queue) 和 collections. deque 模块 支持 队列 的 操作 ,当然 也 
可 以 使 用 Python 列表 进行 二 次 开发 来 实现 自 定义 的 队列 结构 。 例 如 ,下 面 的 Python 2. 7, 11 


代码 演示 了 Queue 模块 的 用 法 : 


>>> import Queue 
>>> q= Queue.Queue () 
>>> q.put (0) 

>>> q.put (1) 

>>> q.-put (2) 

>>> q.queue 
deque([0, 1, 2]) 
>>> q.get () 

0 

>>> q.queue 
deque ([1, 2]) 
>>> q.get () 

1 

>>> q.queue 
deque ([2]) 


#queue in Python 3.x 


# 元 素 人 队 ,添加 到 队列 尾部 


# 队 列 头 元 素 出 队 


另外 ,Queue 和 queue 模块 还 提供 了 “后 进 先 出 ”队列 和 优先 级 队列 ,例如 ,下 面 的 


Python 3. 5. 1 代码 : 


>>> import queue 

>>> LiFoQueue= queue.LifoQueue (5) 
>>> LiFoQueue.put (1) 

>>> LiFoQueue.put (2) 

>>> LiFoQueue.put (3) 

>>> LiFoQueue.get () 

3 

>>> LiFoQueue .get () 


P 


>>> LiFoQueue.get () 
1 


>>> import queue 


>>> PriQueue= queue .PriorityQueue (5) 


#" 后 进 先 出 "队列 


# 优 先 级 队列 
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>>> PriQueue.put (3) 


>>> PriQueue.put (5) 
>>> PriQueue.put (1) 
>>> PriQueue.put (8) 
>>> PriQueue.queue 
(1, 5, 3, 8] 

>>> PriQueue.get () 

1 

>>> PriQueue.get () 

3 

>>> PriQueue.get () 

5 

>>> PriQueue.get () 

8 


下 面 的 代码 使 用 列表 模拟 队列 结构 ,考虑 了 入 队 、` 出 队 、 判 断 队列 是 否 为 空 . 是 否 已 满 以 
及 改变 队列 大 小 等 基本 操作 。 面 向 对 象 编程 的 知识 


例 2-2 自 定义 队列 结构 。 


class myQueue: 
# 构 造 函 数 ,默认 队列 大 小 为 10 
def init__(self, size=10): 
self. content= [] 
self. size=size 


self. current=0 


def setSize(self, size): 


if size <self. current: 


# 如 果 缩 小 队列 ,应 删除 后 面 的 元 素 


for i in range (size, self. current) [:: 


del self. content [i] 
self. current=size 


self. _size=size 


def put (self, v): 
if self._current <self. size: 
self. content .append(v) 
self. current=self._current+1 
else: 


print ("The queue is full") 


def get (self): 
if self._content: 
self. current=self. current- 1 


return self. content .pop (0) 
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-1): 


else: 


print ("The queue is empty') 


def show(sel£) : 
if self. content: 
print (self. content) 
else: 


print ("The queue is empty') 


def empty (self) : 


self. content= [] 


def isEmpty (self): 
if not self. content: 
return True 
else: 


return False 


def isFull (self): 
if self._current ==self. size: 
return True 
else: 


return False 


if name =='_ main _': 
print ("Please use me as a module.') 
将 上 面 的 代码 保存 为 myQueue. py 文件 ,并 保存 在 当前 文件 夹 .Python 3. 5 安装 文件 
Kak sys. path 列表 指定 的 其 他 文件 夹 中 。 下 面 的 代码 演示 了 自 定义 队列 类 的 用 法 。 


>>> import myQueue (5, 7, 'a', 3] 
>>> q= myQueue .myQueue () >>> q.setSize (3) 
>>>q.get () >>> q.show() 

The queue is empty [5, 7, 'a'] 
>>>q.put (5) >>>q.put (10) 
>>>q.put (7) The queue is full 
>>>q.isFull () >>> q.setSize (5) 
False >>> q.put (10) 
>>>q.put ("a') >>>q.show () 

>>> q.put (3) [5, 7, 'a', 10] 


>>> q.show () 


2.6.3 栈 


栈 是 一 种 “后 进 先 出 (Last In First Out. LIFO)” a “ %¢ #£ Ja tH (First In Last Out, 


65 


(Python 程序 设计 (第 2 版 )》 


FILO)” 的 数据 结构 ,Python 列表 本 身 就 可 以 实现 栈 结构 的 基本 操作 。 例 如 ,列表 对 象 的 
append() 方 法 是 在 列表 尾部 追加 元 素 , 类 似 于 入 栈 操 作 ;pop() 方 法 默认 是 弹出 并 返回 列表 
的 最 后 一 个 元 素 , 类 似 于 出 栈 操 作 。 但 是 直接 使 用 Python 列表 对 象 模拟 栈 操作 并 不 是 很 
方便 ,例如 , 当 列 表 为 空 时 , 若 再 执行 pop() 出 栈 操 作 , 则 会 抛 出 一 个 不 很 友好 的 异常 ;另外 ， 
也 无 法 限制 栈 的 大 小 。 例 如 下 面 的 代码 : 


>>> myStack= [] 7 
>>> myStack. append (3) >>> myStack.pop () 

>>> myStack.append (5) 5 

>>> myStack.append (7) >>> myStack.pop () 

>>> myStack 3 

(35. t >>> myStack.pop () 

>>> myStack.pop () IndexError: pop from empty list 


下 面 的 代码 使 用 列表 模拟 栈 结构 的 用 法 ,实现 了 入 栈 、 出 栈 、 判 断 栈 是 否 为 空 、 是 否 已 满 
以 及 改变 栈 大 小 等 操作 。 
例 2-3 自 定义 栈 结构 。 


class Stack: 
def init__(self, size=10): 
self. content= [] # 使 用 列表 存放 栈 的 元 素 
self. size=size # 初 始 栈 大 小 
self. current=0 # 栈 中 元 素 个 数 初始 化 为 0 


def empty (self): 
self. content= [] 


self. current=0 


def isEmpty (self): 
if not self. content: 
return True 
else: 


return False 


def setSize(self, size): 
# 如 果 缩 小 栈 空间 , 则 删除 指定 大 小 之 后 的 已 有 元 素 
if size <self. current: 
for i in range (size, self. current) [::-1]: 
del self._content [i] 
self. current=size 


self. size=size 


def isFull (self): 
if self. current ==self. size: 
return True 


else: 
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Teturn False 


def push (self, v): 
if len(self. content) <self. size: 
self. _content.append(v) 
self. current=self. current+1 
else: 


print ("Stack Full! ') 


def pop (self): 
if self. content: 
self. current=self. current- 1 
return self. content.pop() 
else: 


print ("Stack is empty! ') 


def show(self): 


print (self. content) 


def showRemainderSpace (self) : 


# 栈 中 元 素 个 数 加 1 


# 栈 中 元 素 个 数 减 1 


Print("Stack can still PUSH ', self. size- self. current, ' elements.') 


if name =='_main_': 


print ("Please use me as a module.') 


将 代码 保存 为 Stack. py 文件 ,下 面 的 代码 演示 了 自 定义 栈 结构 的 用 法 。 


>>> import Stack 
>>> s= Stack.Stack() 
>>> s.isEmpty() 
True 

>>> s.isFull() 
False 

>>> s.push (5) 

>>> s.push (8) 

>>> s.push("a') 


>>> 3.pop() 

ta! 
>>>s.push('b') 
>>>s.push('c"') 
>>> s.show() 


[5, 8, "b', 'c'] 


2.6.4 链表 


>>> s.showRemainderSpace () 
Stack can still PUSH 6 elements. 
>>>s.setSize (3) 
>>>s.isFull() 

True 

>>> s.show () 

[5, 8, 'b'] 

>>>s.setSize (5) 
>>>s.push('d') 

>>> s.push ('dddd') 

>>> s.push (3) 

Stack Full! 

>>> s.show() 

[5, 8, 'b', 'd', 'dddd'] 


可 以 直接 使 用 Python 列表 及 其 基本 操作 来 实现 链表 的 功能 ,可 以 很 方便 地 实现 链表 


创建 以 及 节点 的 插入 和 删除 操作 ,当然 也 可 以 对 列表 进行 封装 来 实现 自 定义 的 链表 结构 实 


67 


一 68 


《Python 程序 设计 (第 2 版 )》 


现 特殊 功能 或 更 加 完美 的 外 围 检查 工作 。 下 面 的 代码 直接 使 用 Python 列表 模拟 了 链表 及 


其 基本 操作 : 


>>> LinkTable= [] 

>>> linkTable .append (3) 
>>> linkTable append (5) 
>>> linkTable 

(3, 5] 

>>> linkTable.insert (1, 4) 
>>> linkTable 

[3, 4, 5] 

>>> linkTable.remove (linkTable[1]) 
>>> linkTable 

(3, 5] 


# 在 尾部 追加 节点 


# 在 链表 中 间 插 人 节点 


# 删 除 节点 


如 前 所 述 ,使 用 列表 直接 模拟 链表 结构 时 ,同样 存在 一 些 问题 ,例如 ,链表 为 空 或 删除 的 
元 素 不 存在 时 会 抛 出 异常 ,可 以 对 列表 进行 封装 来 实现 完整 的 链表 操作 ,可 以 参考 队列 与 栈 


的 代码 ,此 处 不 再 袭 述 。 


2.6.5 二 又 树 


下 面 的 代码 实现 了 二 又 树 结构 ,实现 了 二 叉 树 创建 插入 子 节点 以 及 前 序 遍 历 、 中 序 遍 
历 和 后 序 遍 历 等 遍历 方式 ,同时 还 支持 二 叉 树 中 任意 子 树 的 节点 遍历 。 


例 2-4 自 定义 二 叉 树 结构 。 


class BinaryTree: 
def init (self, value): 
self. left=None 
self. right=None 


self. data=value 


def insertLeftChild(self, value): 
if self. left: 


# 创 建 堪 子 树 


print ("left child tree already exists.') 


else: 


self. left=BinaryTree (value) 


return self. left 


def insertRightChild (self, value) : 


if self. right: 


# 创 建 右 子 树 


print ("Right child tree already exists.') 


else: 


self. right=BinaryTree (value) 


return self. right 


def show(self) : 
print (self. data) 


def preOrder (self): 
print (self. data) 
if self. left: 
self. _left.preOrder () 
if self. right: 
self. __right.preOrder () 


def postOrder (self) : 
if self. left: 
self. left.postOrder () 
if self. right: 


self. right.postOrder () 


print (self. data) 


def inOrder (self): 
if self. left: 
self. left.inOrder() 
print (self. data) 
if self. __ right: 
self. right.inOrder() 


if name =='_ main _': 


print ("Please use me as a module.') 


# 前 序 遍 历 
# 输 出 根 节点 的 值 


+A 


PADA FH 


# 后 序 遍 历 


# 中 序 遍 历 


把 上 面 的 代码 保存 为 BinaryTree. py 文件 ,下 面 的 代码 创建 了 图 2-3 所 示 的 二 叉 树 ,并 


对 该 树 进行 遍历 。 


>>> import BinaryTree 


>>> root= BinaryTree.BinaryTree ("root") 


>>> b= root.insertRightChild('B') 
>>> a=root.insertLeftChild('A') 
>>> c=a.insertLeftChild('C') 
>>> d=c.insertRightChild('D') 
>>> e=b. insertRightChild('E') 
>>> f=e.insertLeftChild('F') 
>>> root ..inOrder () 

C D A root B F E 

>>> root .postOrder () 

D CAFE B root 
>>>b.inOrder () 

BFE 


root 


a 


\ 
A y 
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2.6.6 有 向 图 


下 面 的 代码 模拟 了 有 向 图 的 创建 和 路 径 搜索 功能 。 有 向 图 由 若干 节点 和 边 组 成 ,其 中 


每 条 边 都 是 有 明确 方向 的 , 即 从 一 个 节点 指向 另 一 个 节点 。 若 有 向 图 中 两 个 节点 之 间 存 在 
若干 条 有 向 边 , 则 表示 从 起 点 可 以 到 达 终 点 ,认为 存在 一 条 路 径 。 
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例 2-5 自 定义 有 向 图 结构 。 


def searchPath (graph, start, end): 
results= [] 
__generatePath (graph, [start], end, results) 
results.sort (key= lambda x: len (x) ) # 按 所 有 路 径 的 长 度 排序 


return results 


def _generatePath (graph, path, end, results): 

current= path [-1] 
if current ==end: 

results .append (path) 
else: 

for n in graph[current]: 

if n not in path: 
__generatePath (graph, path + [n], end, results) 


def showPath (results) : 
print ('The path from ',results[0][0], ' to ', results[0][-1], ' is:') 
for path in results: 
print (path) 


if name =='_ main _': 
graph= {'A » 'D'], 
'B':['E'], 
CARED ED, 


"By Ey te 

"E':['D'], 

"E':['D', 'G'], 

"G's ("E']} 
rl=searchPath (graph, 'A', 'D') 
showPath (r1) 

程序 运行 结果 为 
Thepathfrom A to D is: 
['A', 'D'] 

['A', 'C', 


['A', "BY, 
['a', cv 


['A', 'c', 'E', 'G', 'E', 'D'] 
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本 章 小 结 


(1) 列表 、 字 符 串 、 元 组 属于 有 序 序列 ,支持 双向 索引 ,支持 使 用 负 整 数 作为 下 标 来 访问 
其 中 的 元 素 , 一 1 表示 最 后 一 个 元 素 位 置 ,一 2 表示 倒数 第 二 个 元 素 位 置 ,以 此 类 推 。 

(2) 在 Python 中 ,同一 个 列表 中 元 素 的 数据 类 型 可 以 各 不 相同 ,可 以 同时 分 别 为 整数 、 
实数 .字符 串 等 基本 类 型 ,也 可 以 是 列表 、 元 组 字典、 集合 以 及 其 他 自 定义 类 型 的 对 象 , 并 且 
支持 复杂 数据 类 型 对 象 的 典 套 。 

(3) 字典 和 集合 属于 无 序 序列 ,集合 不 支持 使 用 下 标的 方式 来 访问 其 中 的 元 素 ,可 以 使 
用 字典 的 “ 键 " 作 为 下 标 来 访问 字典 中 的 “ 值 ”。 

(4) 如 果 要 创建 只 包含 一 个 元 素 的 元 组 ,只 把 元 素 放 在 圆 括号 里 是 不 行 的 ,还 需要 在 元 
素 后 面 加 一 个 逗号 ”,”。 

(5) 将 列表 、 元 组 或 字符 串 对 象 与 一 个 整数 进行 * 运算 ,表示 将 对 象 中 的 元 素 进行 重复 
并 返回 一 个 新 的 同类 型 对 象 。 

(6) 虽然 “十 ”运算 符 可 以 连接 两 个 列表 对 象 ,但 并 不 是 原 地 修改 列表 ,而 是 返回 一 个 新 
列表 ,不 对 原 列表 对 象 做 任何 修改 。 并 且 该 运算 符 涉及 大 量 的 元 素 赋值 操作 ,效率 较 低 , 建 
议 优先 考虑 使 用 列表 对 象 的 append() 方 法 。 

(7) 推荐 使 用 字典 对 象 的 get() 来 访问 其 中 的 元 素 。 

(8) 列表 、 字 典 、 集 合 属于 可 变 序列 ,元 组 ,字符 串 属于 不 可 变 序列 。 

(9) 虽然 列表 支持 在 列表 中 间 任 意 位 置 插 入 和 删除 元 素 ,但 一 般 建议 尽量 从 列表 的 尾 
部 进行 元 素 的 增加 与 删除 ,这 样 可 以 获得 更 高 的 速度 。 

(10) 切片 操作 不 仅 可 以 用 来 返回 列表 、 元 组 ,字符 串 中 的 部 分 元 素 ,还 可 以 对 列表 中 的 
元 素 值 进行 修改 ,以 及 增加 或 删除 列表 中 的 元 素 。 

CLL) 关键 字 in 可 以 用 于 列表 以 及 其 他 可 迭代 对 象 ,包括 元 组 .字典 、range 对 象 .字符 
串 、 集 合 等 ,常用 在 循环 语句 中 对 序列 或 其 他 可 和 迭代 对 象 中 的 元 素 进 行 遍历 。 

(12) 列表 推导 式 可 以 使 用 简洁 的 形式 来 生成 满足 特定 需要 的 列表 。 

(13) 序列 解 包 在 多 个 场合 具有 重要 的 应 用 ,是 Python 的 基本 操作 之 一 。 

(14) 字典 中 的 “ 键 " 可 以 是 Python 中 任意 不 可 变数 据 , 比 如 整数 .实数 .复数 .字符 串 、 
元 组 等 ,但 不 能 使 用 列表 、 集 合 、 字 典 作为 字典 的 “ 键 ”, 因 为 这 些 类 型 的 对 象 是 可 变 的 。 

(15) 字典 中 的 “ 键 " 不 允许 重复 ,“ 值 ”是 可 以 重复 的 。 

(16) 集合 中 的 所 有 元 素 不 允许 重复 ,可 以 使 用 集合 快速 提取 其 他 序列 中 的 唯一 元 素 。 

(17) 内 置 函 数 len( 列 表 ) 可 以 用 来 返回 列表 中 的 元 素 个 数 , 同 样 适用 于 元 组 ,字典 、 集 
FFE EB range 对 象 等 其 他 可 和 迭代 对 象 。 

(18) 内 置 函 数 zip( 列 表 1, 列 表 2,…) 可 以 将 多 个 列表 或 元 组 对 应 位 置 的 元 素 组 合 为 
元 组 ,并 返回 包含 这 些 元 组 的 列表 (Python 2. x) 或 zip 对 象 (Python 3. x). 

(19) AERX enumerate( 可 和 迭代 对 象 ) 可 以 用 来 枚 举 列 表 、 元 组 或 其 他 可 选 代 对 象 的 
元 素 , 返 回 枚 举 对 象 , 枚 举 对 象 中 每 个 元 素 是 包含 下 标 和 元 素 值 的 元 组 。 
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J af 
. 为 什么 应 尽量 从 列表 的 尾部 进行 元 素 的 增加 与 删除 操作 ? 
. range() PARE Python 2. x 中 返回 一 个 ,而 Python 3. x 的 range O pi BGK 
回 一 个 


.编写 程序 ,生成 包含 1000 个 0 一 100 之 间 的 随机 整数 ,并 统计 每 个 元 素 的 出 现 次 数 。 
. 表达 式 “[3] in [1,2,3,4]” 的 值 为 
.编写 程序 ,用 户 输入 一 个 列表 和 2 个 整数 作为 下 标 , 然 后 输出 列表 中 介 于 2 个 下 标 


之 间 的 元 素 组 成 的 子 列表 。 例 如 用 户 输入 [1,2,3,4,5,6] 和 2,5 ,程序 输 出 [3,4， 
5,6]。 


. 列表 对 象 的 sort() 方 法 用 来 对 列表 元 素 进行 原 地 排序 ,该 函数 返回 值 为 
. 列表 对 象 的 方法 删除 首次 出 现 的 指定 元 素 , 如 果 列 表 中 不 存在 要 删除 的 元 


素 , 则 抛 出 异常 。 


. 假设 列表 对 象 aList 的 值 为 [3,4,5,6,7,9,11,13,15,17], 那 么 切片 aList[3:7] 得 到 
的 值 是 
. 设计 一 个 字典 ,并 编写 程序 ,用 户 输入 内 容 作 为 “ 键 ”, 然 后 输出 字典 中 对 应 的 “ 值 ”， 


如 果 用 户 输 入 的 “ 键 ” 不 存在 , 则 输出 "您 输入 的 键 不 存在 1”。 


. 编写 程序 ,生成 包含 20 个 随机 数 的 列表 ,然后 将 前 10 个 元 素 升 序 排列 ,后 10 个 元 


素 降序 排列 ,并 输出 结果 。 


. 在 Python 中 ,字典 和 集合 都 是 用 一 对 作为 界定 符 , 字 典 的 每 个 元 素 有 两 


部 分 组 成 , 即 和 ,其 中 不 允许 重复 。 


. 使 用 字典 对 象 的 方法 可 以 返回 字典 的 “ 键 - 值 对 ”列表 ,使 用 字典 对 象 


的 方法 可 以 返回 字典 的 “ 键 " 列 表 , 使 用 字典 对 象 的 方法 可 以 返 
回 字典 的 “ 值 "列表 。 


.假设 有 列表 a 二 [name','age','sex |] 和 b 二 ['Dong',38,'"Male'], 请 使 用 一 个 语句 将 这 


两 个 列表 的 内 容 转换 为 字典 ,并 且 以 列表 a 中 的 元 素 为 “ 键 ”, 以 列表 b 中 的 元 素 为 
“ 值 ”, 这 个 语句 可 以 写 为 


. 假设 有 一 个 列表 a, 现 要 求 从 列表 a 中 每 3 个 元 素 取 1 个 ,并 且 将 取 到 的 元 素 组 成 


新 的 列表 b, 可 以 使 用 语句 


. 使 用 列表 推导 式 生成 包含 10 个 数字 5 的 列表 ,语句 可 以 写 为 
(可 以 \ 不 可 以 ) 使 用 del 命令 来 删除 元 组 中 的 部 分 元 素 。 


第 3 章 选择 与 循环 


在 传统 的 面向 过 程 程序 设计 中 有 3 种 经 典 的 控制 结构 , 即 顺序 结构 ,选择 结构 和 循环 结 
构 。 即 使 是 在 面向 对 象 程序 设计 语言 中 以 及 事件 驱动 或 消息 驱动 应 用 开发 中 ,也 无 法 脱离 
这 3 种 基本 的 程序 结构 。 可 以 说 ,不 管 使 用 哪 种 程序 设计 语言 ,在 实际 开发 中 ,为 了 实现 特 
定 的 业务 迎 辑 或 算法 ,都 不 可 避免 地 要 用 到 大 量 的 选择 结构 和 循环 结构 ,并 且 经 常 需 要 将 选 
择 结构 和 循环 结构 嵌 套 使 用 。 本 章 首 先 介绍 条 件 表达 式 和 Python 中 选择 结构 与 循环 结构 
的 语法 ,然后 通过 几 个 示例 来 理解 其 用 法 。 


3.1 条 件 表达 式 


在 选择 结构 和 循环 结构 中 ,都 要 使 用 条 件 表达 式 来 确定 下 一 步 的 执行 流程 。 在 Python 
中 ,单个 常量 .变量 或 者 任意 合法 表达 式 都 可 以 作为 条 件 表达 式 。 在 条 件 表 达 式 中 可 以 使 用 
1.4.5 节 介绍 的 所 有 运算 符 。 

(1) 算术 运算 符 : +、-、# 1/8 

(2) 关系 运算 符 : >、<、==、<=、>=、!=(Python 2. x 还 支持 “<>” 运 算 符 ,表示 不 等 于 ; 
Python 3. x 不 支持 “<>” 运 算 符 )。 

(3) 测试 运算 符 : in ,not in,is,is not. 

(A) RAIT: and、or、not。 

(5) 位 运算 符 : ~、&、|、^、<<、>>。 

(6) 矩阵 运算 符 : @。 

在 选择 和 循环 结构 中 ,条 件 表达 式 的 值 只 要 不 是 False, 0k 0. 0,0) 等 )、 空 值 None、 空 
列表 、 空 元 组 、 空 集合 、 空 字典 、 空 字符 串 、 空 range 对 象 或 其 他 空 迭 代 对 象 ,Python 解释 器 
均 认为 与 True 等 价 。 从 这 个 意义 上 来 讲 , 几 乎 所 有 的 Python 合法 表达 式 都 可 以 作为 条 件 
表达 式 ,包括 含 有 函数 调用 的 表达 式 。 例 如 : 


>>> if 3: # 使 用 整数 作为 条 件 表达 式 
print (5) 

5 

>>> a= [1, 2, 3] 

>>> if a: # 使 用 列表 作为 条 件 表达 式 
print (a) 

(1, 2, 3] 

>>> a= [] 

>>> if a: 
print (a) 

else: 


print ("empty") 
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empty 
>>> i=s=0 
>>> while i<=10: # 使 用 关系 表达 式 作为 条 件 表达 式 
st=i 
it=1 
>>> i=s=0 
>>> while True: # 使 用 常量 True 作为 条 件 表 达 式 
st=i 
it=1 
if i> Wi 
break 
>>> s=0 
>>> for i in range (0, 11, 1): 


st=i 


关于 表达 式 和 运算 符 的 详细 内 容 在 1.4.5 节 中 已 有 介绍 eA AS FE GS «Fh 
下 条 件 表达 式 中 比较 特殊 的 几 个 运算 符 。 首 先是 关系 运算 符 , 与 很 多 语言 不 同 的 是 ,在 
Python 中 的 关系 运算 符 可 以 连续 使 用 ,例如 : 


>>> print (1<2<3) 
True 

>>> print (1< 2> 3) 
False 

>>> print (1< 3> 2) 


True 


RERIK INZ IEA ENA FF and 和 or, 这 两 个 运算 符 具 有 短路 求 值 或 惰性 求 值 
的 特点 ,简单 地 说 ,就 是 只 计算 必须 计算 的 表达 式 的 值 。 在 设计 条 件 表达 式 时 ,在 表示 复杂 
条 件 时 如 果 能 够 巧妙 利用 逻辑 运算 符 and 和 or 的 短路 求 值 或 惰性 求 值 特性 ,可 以 大 幅度 提 
高 程序 的 运行 效率 ,减少 不 必要 的 计算 与 判断 。 以 and 为 例 ,对 于 表达 式 “ 表 达 式 1 and 表 
达 式 2” 而 言 ,如 果 “ 表 达 式 1” 的 值 为 False 或 其 他 等 价值 时 ,不 论 “表达 式 2 的 值 是 什么 , 整 
个 表达 式 的 值 都 是 False, 此 时 “表达 式 2” 的 值 无 论 是 什么 都 不 影响 整个 表达 式 的 值 ,因此 
将 不 会 被 计算 ,从 而 减少 不 必要 的 计算 和 判断 。 逮 辑 或 运算 符 or 也 具有 类 似 的 特点 ,读者 
可 以 自行 分 析 。 在 设计 条 件 表达 式 时 ,如 果 能 够 大 概 预测 不 同 条 件 失败 的 概率 ,并 将 多 个 条 
件 根据 and 和 or 运算 的 短路 求 值 特性 进行 组 织 , 可 以 大 幅度 提高 程序 运行 效率 。 例 如 ,下 
面 的 函数 用 来 使 用 用 户 指 定 的 分 隔 符 将 多 个 字符 串 连 接 成 一 个 字符 串 , 如 果 用 户 没 有 指定 
分 隔 符 , 则 使 用 逗号 。 


>>> def Join(chList, sep=None) : 
return (sep or ',') .join (chList) 

>>> chifest= ["1', "2", "3", 14", 5 可 

>>> Join (chTest) 

#1, 2;4,8)5* 

>>> Join (chTest, ':') 

"1:2:3:4:5" 
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>>> Join(chTest, ' ') 
12345" 


当然 ,还 可 以 把 上 面 的 函数 直接 定义 为 下 面 的 形式 : 
>>> def Join(chList, sep=','): 
return sep.join (chList) 
另外 ,在 Python 中 ,条 件 表达 式 中 不 允许 使 用 赋值 运算 符 “ 二 ”, 避 免 了 某 些 语言 中 误 
将 关系 运算 符 “ 二 二 "写作 赋值 运算 符 “==” 带 来 的 麻烦 ,例如 下 面 的 代码 ,在 条 件 表达 式 中 使 
用 赋值 运算 符 “ 二 ”将 抛 出 异常 ,提示 语法 错误 。 
>>> if a=3: 


SyntaxError: invalid syntax 


3.2 选择 结构 


选择 结构 通过 判断 某 些 特定 条 件 是 否 满 足 来 决定 下 一 步 的 执行 流程 ,是 非常 重要 的 控 
制 结构 。 常 见 的 有 单 分 支 选择 结构 、 双 分 支 选 择 结构 、 多 分 支 选择 结构 、 嵌 套 的 分 支 结构 , 形 
式 比较 灵活 多 变 , 具 体 使 用 哪 一 种 最 终 还 是 取决 于 所 要 实现 的 业务 旬 辑 。 从 某 种 意义 上 讲 ， 
后 面 章节 中 讲 到 的 循环 结构 和 异常 处 理 结构 中 也 可 以 带 有 else 子 句 ,可 以 看 作 是 选择 结构 
的 一 种 变形 。 
3.2.1 单 分 支 选择 结构 

单 分 支 选择 结构 是 最 简单 的 一 种 形式 ,其 语法 如 下 所 示 , 其 中 表达 式 后 面 的 冒号 *: "是 
不 可 缺少 的 ,表示 一 个 语句 块 的 开始 ,后 面 几 种 其 他 形式 的 选择 结构 和 循环 结构 中 的 冒号 
是 必须 有 的 。 

if 表达 式 : 

语句 块 

当 表 达 式 值 为 True 或 其 他 等 价值 时 ,表示 条 件 满足 ,语句 块 将 被 执行 ,否则 该 语句 块 
将 不 被 执行 。 

x= input ("Input two numbers:') 

a, b=map (int, x.split()) 

if a>b: 


a, b=b, a 
print (a, b) 


3.2.2 双 分 支 选择 结构 
双 分 支 选择 结构 的 语法 为 


if 表达 式 : 
语句 块 1 
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else: 


语句 块 2 
当 表达 式 值 为 True 或 其 他 等 价值 时 ,执行 语句 块 1 ,否则 执行 语句 块 2。 下 面 的 代码 演 


示 了 双 分 支 选择 结构 的 用 法 : 


>>> chTest=["1', '2", '3', '4", '5"] 
>>> if chTest: 
print (chTest) 
else: 
print ('Empty') 
A 
Python 还 支持 如 下 形式 的 表达 式 : 


valuel if condition else value2 


当 条 件 表 达 式 condition 的 值 与 True 等 价 时 ,表达 式 的 值 为 valuel ,否则 表达 式 的 值 为 


value2。 另 外 ,在 valuel 和 value2 中 还 可 以 使 用 复杂 表达 式 , 包 括 函 数 调用 和 基本 输出 语 


句 。 下 面 的 代码 演示 了 上 面 的 表达 式 的 用 法 ,从 代码 中 可 以 看 出 ,这 个 结构 的 表达 式 也 具有 
惰性 求 值 的 特点 。 


>>> a=5 

>>> print (6) if a>3 else print (5) 

6 

>>> print (6 if a>3 else 5) 

6 

>>> b= 6 if a>13 else 9 

>>>b 

9 

>>> x=math.sqrt (9) if 5> 3 else random.randint (1, 100) # 此 时 还 没有 导入 math 模块 
NameError: name 'math' is not defined 

>>> import math 

# 此 时 还 没有 导入 random 模 块 ,但 由 于 条 件 表达 式 5>3 的 值 为 rrue, 所 以 可 以 正常 运行 
>>> x=math.sqrt (9) if 5>3 else random. randint (1,100) 

# 此 时 还 没有 导入 random 模 块 ,由 于 条 件 表达 式 2>3 的 值 为 false, 需 要 计算 第 二 个 表达 式 的 值 ,因此 
出 错 

>>> x=math.sqrt (9) if 2> 3 else random.randint (1, 100) 

NameError: name 'random' is not defined 

>>> import random 

>>> x=math.sqrt (9) if 2>3 else random.randint (1, 100) 


3.2.3 多 分 支 选择 结构 


多 分 支 选择 结构 为 用 户 提供 了 更 多 的 选择 ,可 以 实现 复杂 的 业务 逻辑 ,多 分 支 选择 结构 


的 语法 为 
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if 表达 式 1: 


语句 块 1 
elif 表达 式 2: 
语句 块 2 
elif 表达 式 3: 
语句 块 3 


else: 


语句 块 n 


其 中 ,关键 字 elif 是 else if 的 缩写 。 下 面 的 代码 演示 了 利用 多 分 支 选 择 结构 将 成 绩 从 百 分 
制 变换 到 等 级 制 的 实现 方法 。 


>>> def func (score): 
if score>100: 
return 'wrong score.must<=100.' 
elif score>=90: 
return 'A' 
elif score>=80: 
return 'B' 
elif score>=70: 
return 'C' 
elif score>=60: 
return 'D' 
elif score>=0: 
return 'E' 
else: 
return 'wrong score.must>0' 
>>> func (120) 
‘wrong score.must<= 100. ' 
>>> func (99) 
‘AY 
>>> func (87) 
1B 
>>> func (62) 
"pt 
>>> func (3) 
E 
>>> func (- 10) 


"wrong score.must> 0' 


3.2.4 ARARE 
FRA ITRE TEU : 
if 表达 式 1: 


语句 块 1 
if 表达 式 2: 


at 
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语句 块 2 
else: 
语句 块 3 
else: 
if 表达 式 4: 
语句 块 4 


使 用 该 结构 时 ,一 定 要 严格 控制 好 不 同 级 别 代码 块 的 缩 进 量 , 因 为 这 决定 了 不 同 代码 块 
的 从 属 关系 以 及 业务 逻辑 是 否 被 正确 地 实现 ,是 否 能 够 被 Python 正确 理解 和 执行 。 例 如 ， 
3.2. 3 节 中 百分制 转 等 级 制 的 示例 ,作为 一 种 编程 技巧 ,还 可 以 尝试 下 面 的 写法 : 


>>> def func (score) : 
degree= 'DCBAAE' 
if score> 100 or score< 0: 
return 'wrong score.must between 0 and 100." 
else: 
index= (score- 60) //10 
if index>=0: 
return degree [index] 
else: 


return degree [- 1] 


3.2.5 选择 结构 应 用 案例 
例 3-1 面试 资格 确认 。 


age= 24 
subject= "计算 机 " 
college= " 非 重点 " 
if (age> 25 and subject== "电子 信息 工程 ") or (college==" 重 点 " and subject== "电子 信 息 工 程 ") 
or (age<=28 and subject== "计算 机 ") : 
print (" 蒜 喜 , 您 已 获得 我 公司 的 面试 机 会 !) 
else: 


print ("#0 aK ,您 未 达到 面试 要 求 ") 


例 3-2 用户 输入 若干 个 成 绩 , 求 所 有 成 绩 的 总 和 。 每 输入 一 个 成 绩 后 询问 是 否 继续 
输入 下 一 个 成 绩 , 回答 yes 就 继续 输入 下 一 个 成 绩 ,回答 no 就 停止 输入 成 绩 。 


endFlag= 'yes' 
s=0 
while endFlag.lower()==' yes': 
x= input (" 请 输入 一 个 正 整数 : ") 
x=eval (x) 
if isinstance(x, int) and 0<=x<=100: 
s=stx 
else: 


print ("不 是 数字 或 不 符合 要 求 ') 
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endFlag= raw_input(" 继 续 输 入 ? (yes or no)") 
print (整数 之 和 = '，s) 


例 3-3 编写 程序 ,判断 某 天 是 某 年 第 几 天 。 
本 例 要 点 是 冰 年 判断 时 条 件 表达 式 的 写法 以 及 关系 运算 符 、 逻 辑 运 算 符 和 切片 的 运用 。 


import time 


def demo (year, month, day): 


day month= [31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31] # 每 个 月 的 天 数 
if year% 400==0 or (year% 4==0 and year% 100!=0): # 判 断 是 否 为 闽 年 
day_month[1]=29 # 闽 年 2 月 为 29 天 
if month==1: 
return day 
else: 


return sum(day month[:month- 1]) +day 


date=time.localtime() 
year, month, day=date[:3] 
print (demo (year, month, day) ) 


标准 库 datetime 提供 了 timedelta 对 象 可 以 很 方便 地 计算 指定 年 .月 日. 时、 分 、 秒 之 前 
或 之 后 的 日 期 时 间 ,还 提供 了 返回 结果 中 包含 “今天 是 今年 第 几 天 ”今天 是 本 周 第 几 天 ”等 
答案 的 timetupleQ 函数 ,等 等 。 


>>> import datetime 

>>> Today= datetime.date. today () 

>>> Today 

datetime.date (2015, 12, 6) 

>>> Today- datetime.date (Today. year, 1, 1) + datetime.timedelta (days= 1) 
datetime.timedelta (340) 


>>> Today. timetuple () .tm yday # 今 天 是 今年 的 第 几 天 
340 

>>> Today. replace (year= 2013) # 替 换 日 期 中 的 年 
datetime.date (2013, 12, 6) 

>>> Today .replace (month= 1) # 替 换 日 期 中 的 月 


datetime.date (2015, 1, 6) 
>>> now=datetime.datetime.now() 
>>> now 


datetime.datetime (2015, 12, 6, 16, 1, 6, 313898) 


>>> now. replace (second= 30) # 替 换 日 期 时 间 中 的 秒 
datetime.datetime (2015, 12, 6, 16, 1, 30, 313898) 

>>>nowt datetime.timedelta (days= 5) # 计 算 5 天 后 的 日 期 时 间 
datetime.datetime (2015, 12, 11, 16, 1, 6, 313898) 

>>>now + datetime.timedelta (weeks=- 5) # 计 算 5 周 前 的 日 期 时 间 


datetime.datetime (2015, 11, 1, 16, 1, 6, 313898) 
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3.3 循环 结构 
3.3.1 for 循环 与 while 循环 


Python 提供 了 两 种 基本 的 循环 结构 : while 循环 和 for 循环 。 其 中 , while 循环 一 般 用 
于 循环 次 数 难 以 提前 确定 的 情况 ,当然 也 可 以 用 于 循环 次 数 确定 的 情况 ;for 循环 一 般 用 于 
循环 次 数 可 以 提前 确定 的 情况 ,尤其 适用 于 枚 举 或 遍历 序列 或 迭代 对 象 中 元 素 的 场合 ,编程 
时 一 般 建 议 优先 考虑 使 用 for 循环 。 相同 或 不 同 的 循环 结构 之 间 可 以 互相 嵌 套 ,也 可 以 与 
选择 结构 蔡 套 使 用 ,用 来 实现 更 为 复杂 的 逻辑 。 

while 循环 和 for 循环 常见 的 用 法 为 

while 条 件 表达 式 : 

循环 体 


和 


for 变量 in 序列 或 其 他 迭代 对 象 : 
循环 体 
另外 ,while 循环 和 for 循环 都 可 以 带 else 子 句 ,如 果 循环 因为 条 件 表达 式 不 成 立 而 自 
然 结束 (不 是 因为 执行 了 break 而 结束 循环 ) , 则 执行 else 结构 中 的 语句 ;如 果 循 环 是 因为 执 
行 了 break 语句 而 导致 循环 提前 结束 , 则 不 执行 else 中 的 语句 。 其 语法 形式 为 
while 条 件 表 达 式 : 
循环 体 


else: 


else 子 句 代码 块 
和 


for 取 值 in 序列 或 迭代 对 象 : 
循环 体 
else: 


else 子 句 代 码 块 


3.3.2 循环 结构 的 优化 

为 了 优化 程序 以 获得 更 高 的 效率 和 运行 速度 ,在 编写 循环 语句 时 ,应 尽量 减少 循环 内 部 
不 必要 的 计算 ,将 与 循环 变量 无 关 的 代码 尽 可 能 地 提取 到 循环 之 外 。 对 于 使 用 多 重 循环 嵌 
套 的 情况 ,应 尽量 减少 内 层 循环 中 不 必要 的 计算 , 尽 可 能 地 向 外 提 。 例 如 下 面 的 代码 ,第 二 
段 明 显 比 第 一 段 的 运行 效率 要 高 。 


import time 
digits= (1, 2, 3, 4) 


start=time.time() 
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for i in range(1000) : 
result= [] 
for i in digits: 
for j in digits: 
for k in digits: 
result append (i * 100+j * 10+k) 
print (time.time ()- start) 


print (result) 


start=time.time() 
for i in range (1000) : 
result= [] 
for i in digits: 
i=i* 100 
for j in digits: 
FIt 
for k in digits: 
result.append (i+ j+k) 
print (time.time()- start) 


print (result) 


另外 ,在 循环 中 应 尽量 引用 局 部 变量 ,因为 局 部 变量 的 查询 和 访问 速度 比 全 局 变量 略 
快 ,在 使 用 模块 中 的 方法 时 ,可 以 通过 将 其 转换 为 局 部 变量 来 提高 运行 速度 。 例 如 : 


import time 
import math 
start=time.time() # 获 取 当 前 时 间 
for i in range (10000000) : 
math.sin(i) 
print ("Time Used:', time.time()- start) # 输 出 所 用 时 间 
loc_sin=math.sin 
start=time.time() 
for i in range (10000000) : 
loc_sin (i) 


print ('Time Used:', time.time()- start) 


这 段 代 码 演示 了 模块 方法 的 两 种 不 同调 用 方式 ,并 比较 各 自 的 运行 时 间 。 第 1 章 还 介 
绍 过 另外 一 种 导入 和 使 用 模块 成 员 的 方法 ,把 上 面 的 代码 修改 为 


import time 


from math import sin as sin 


start=time.time() 
for i in range (10000000) : 
sin (i) 


print ("Time Used:', time.time()- start) 
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loc sin= sin 

start=time.time() 

for i in range (10000000) : 
loc sin(i) 


print ("Time Used:', time.time()- start) 


从 代码 运行 结果 可 以 看 出 ,效率 也 略 有 提高 。 
3.4 break 和 continue 语句 


break 语句 和 continue 语句 在 while 循环 和 for 循环 中 都 可 以 使 用 ,并 且 一 般 常 与 选择 
结构 结合 使 用 ,以 达到 在 特定 条 件 得 到 满足 时 跳出 循环 的 目的 。 一 旦 break 语句 被 执行 ,将 
使 得 整个 循环 提前 结束 。continue 语句 的 作用 是 终止 本 次 循环 ,并 忽略 continue 之 后 的 所 
有 语句 ,直接 回 到 循环 的 顶端 ,提前 进入 下 一 次 循环 。 需 要 注意 的 是 ,过 多 的 break 和 
continue 会 严重 降低 程序 的 可 读 性 。 除 非 break 或 continue 语句 可 以 让 代码 更 简单 或 更 清 
晰 ,和 否则 不 要 轻易 使 用 。 

下 面 的 代码 用 来 计算 小 于 100 的 最 大 素数 ,请 注意 break 语句 和 else 子 句 的 用 法 。 


>>> for n in range(100, 1, - 1): 
for i in range(2, n): 
if nti==0: 
break 
else: 
print (n) 
break 
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删除 上 面 代码 中 最 后 一 个 break 语句 .可 以 用 来 输出 100 以 内 的 所 有 素数 。 
在 编写 循环 结构 代码 时 ,一 定 要 警惕 continue 语句 可 能 带 来 的 问题 ,例如 ,下 面 的 代码 
本 意 是 用 来 输出 10 以 内 的 奇数 : 


>>> i=l 
>>> while i<10: 
if it2==0: 
continue 
print (i, end=' ') 
it=1 
但 是 由 于 代码 设计 存在 问题 ,从 而 导致 这 个 循环 变 成 了 永 不 结束 的 死 循环 ,需要 按 
Ctrl+C 组 合 键 来 强行 终止 。 出 现 这 种 情况 的 原因 是 : 一 旦 条 件 表达 式 “i%2 二 二 0” 得 到 满 
足以 后 执行 continue 语句 ,之 后 的 “i 十 王 1? 语 名 将 永远 不 再 执行 ,循环 变量 永远 停留 在 当前 
的 值 , 从 而 使 得 循环 无 法 结束 。 上 面 的 代码 改 成 下 面 这 样 就 不 会 有 问题 了 : 


>>> i=0 


>>> while i<10: 


82 


选择 与 循环 


it=1 
if i82==0: 
continue 


print (i, end=' ') 
当然 ,也 可 以 使 用 更 简洁 的 for 循环 来 实现 : 


>>> for i in range (10) : 
if i82==0: 
continue 


print (i, end=" ') 
为 了 充分 理解 ,让 我 们 再 修改 一 下 : 


>>> for i in range(10): 
if i%2==0: 
it=1 
continue 


print (i, end=' ') 


在 这 段 代码 中 ,条 件 语句 中 continue 之 前 的 语句 “i 十 三 1” 并 没有 起 到 任何 作用 。 之 所 
以 会 这 样 ,是 因为 Python 基于 值 的 内 存 管 理 方式 。 每 次 进入 循环 时 的 变量 i 已 经 不 再 是 上 
一 次 的 变量 i, 所 以 修改 其 值 并 不 会 影响 循环 的 执行 ,例如 ; 


>>> for i in range (5): 
print (id(i), ':', i) 

10416692 : 0 

10416680 : 1 

10416668 : 2 

10416656 : 3 

10416644 : 4 


3.5 案例 精 选 


例 3-4 计算 1 十 2 十 3 十 … 十 100 的 值 。 
对 于 这 样 比较 规则 的 循环 ,一 般 优先 考虑 使 用 for 循环 ,参考 代码 如 下 : 


s=0 
for i in range (1, 101): 
s=sti 
print ("1+ 2+3+++++100=', s) 
print ("1+ 2+ 3+++++100="', sum(range(1, 101))) # 直 接 使 用 内 置 函 数 来 实现 题目 的 要 求 


例 3-5 输出 序列 中 的 元 素 。 
对 于 类 似 元 素 遍 历 的 问题 ,一 般 也 优先 考虑 使 用 for 循环 ,参考 代码 如 下 : 


a_list=['a', 'b', 'mpilgrim', 'z', ‘example'] 


for i, v in enumerate (a list): 


《Python 程序 设计 (第 2 版 )》 


print ("列表 的 第 ',，i+1, ' 个 元 素 是 : ', v) 


对 于 类 似 元 素 遍历 的 问题 ,同样 也 可 以 使 用 while 循环 来 解决 ,但 是 代码 要 麻烦 一 些 ， 
可 读 性 也 较 差 ,例如 : 


>>>a list=['a', 'b', 'mpilgrim', 'z', 'example'] 
>>> i=0 
>>> number=len(a_list) 
>>> while i<number: 
print (‘PAH ', it1, ‘PIKE: ', a list[i]) 


it=1 
例 3-6 求 1 一 100 之 间 能 被 7 整除 ,但 不 能 同时 被 5 整除 的 所 有 整数 。 


for i in range(1, 101): 
if is7==0 and i5!=0: 
print (i) 


例 3-7 输出 “水 仙 花 数 "。 所 谓 水 仙 花 数 是 指 1 个 3 位 的 十 进 制 数 ,其 各 位 数字 的 立方 
和 恰好 等 于 该 数 本 身 。 例 如 ,153 是 水 仙 花 数 , 因 为 153 王 1 十 5 十 33? 。 


for i in range(100, 1000): 
ge=i %10 
shi=i // 10 %10 
bai=i // 100 
if ge**3+ shi** 3+ bai**3==i: 
print (i) 


例 3-8 求 平均 分 。 


score= [70, 90, 78, 85, 97, 94, 65, 80] 
s=0 
for i in score: 

st=i 


print (s/len (score) ) 
也 可 以 使 用 下 面 的 内 置 函 数 来 计算 平均 分 : 
print (sum(score) /len (score) ) 


上 面 的 代码 是 Python 3. 5. 1 中 编写 的 ,如 果 使 用 Python 2. x, 输 出 语句 需要 写成 下 面 
的 形式 : 


print sum(score) * 1.0/len (score) 
例 3-9 打印 九 九 乘法 表 。 


for i in range(1, 10): 
for j in range(1, i+1): 
print (i, **', j, '=", is 4, AE end="") 
print () # 打 印 空 行 


— a 


例 3-10 R 200 以 内 能 被 17 整除 的 最 大 正 整 数 。 


for i in range (200, 0, -1): 
if i%17==0: 
print (i) 
break 


例 3-11 判断 一 个 数 是 否 为 素数 。 
本 例 主要 演示 循环 结构 中 else 子 句 的 用 法 。 


import math 


n= input ("Input an inter:') 
n= int (n) 
m=math.ceil (math.sqrt (n)+1) 
for i in range(2, m): 

if nbi ==0 and i<n: 


print ("No") 
break 
else: 
print ("Yes") 


math 是 用 于 数学 计算 的 标准 库 , 除 了 用 于 平方 根 函 数 sqrt() 和 取 整 函数 ceil(), 还 提供 
了 最 大 公约 数 函 数 gcd() ,sin()、asin() 等 三 角 函 数 与 反 三 角 函 数 ,弧度 与 角度 转换 函数 
degrees() ,radians() ,误差 函数 erf() ,剩余 误差 函数 erfcO . (i ph BW gamma(), 对 数 函 数 
logO \log2O ,log100) ,阶乘 函数 factorial() ,常数 pi 和 e, 等 等 。 

例 3-12 鸡 免 同 笼 问 题 。 假 设 共 有 鸡 、 免 30 只 , 脚 90 只 , 求 鸡 . 免 各 有 多 少 只 。 


for ji in range (0, 31): 
if 2* jit (30- ji) * 4==90: 


print ("ji:", ji, " tu:", 30-74) 
例 3-13 编写 程序 ,输出 由 1、2、3、4 这 4 个 数字 组 成 的 每 位 数 都 不 相同 的 所 有 三 位 数 。 


digits= (1, 2, 3, 4) 
for i in digits: 
for j in digits: 
for k in digits: 
if i!=j and j!=k and i!=k: 
print (i * 100+ j * 10+k) 
从 代码 优化 的 角度 来 讲 ,上 面 这 段 代 码 并 不 是 很 好 ,其 中 有 些 判 断 完全 可 以 在 外 层 循环 
来 做 ,从 而 提高 运行 效率 ,下 面 形 式 的 代码 运行 效率 比 上 面 的 代码 要 高 一 些 。 
digits= (1, 2, 3, 4) 
for i in digits: 
for j in digits: 


if j==i: 
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continue 
for k in digits: 
if k==i or k==j: 
continue 


print (i * 100+ jx 10+k) 


例 3-14 编写 程序 ,生成 一 个 含有 20 个 随机 数 的 列表 ,要 求 所 有 元 素 不 相同 ,并 且 每 个 
元 素 的 值 介 于 1 一 100 之 间 。 


import random 


x=[] 
while True: 
if len(x)==20: 
break 
n= random. randint (1, 100) 
if n not in x: 
x.append (n) 
print (x) 


例 3-15 HERY TAA C.i) MA n PERHERE i 个 ,有 多 少 种 选 法 。 

根据 组 合 数 定义 ,需要 计算 3 个 数 的 阶乘 ,在 很 多 编程 语言 中 都 很 难 直接 使 用 整 型 变量 
表示 大 数 的 阶乘 结果 ,虽然 Python 并 不 存在 这 个 问题 ,但 是 计算 大 数 的 阶乘 仍 需 要 相当 多 
的 时 间 。 本 例 提供 另 一 种 计算 方法 : 以 Cni(8.3) 为 例 , 按 定义 式 展开 为 Cni(8,3) 王 81/31/ 
(8 一 3)! 二 (8X7X6X5X4X3X2X1)/(3X2X1)/(5X4X3X2X1), 对 于 (5,8] 区 间 的 数 ， 
分 子 上 出 现 一 次 而 分 母 上 没 出 现 ;(3,5j 区 间 的 数 在 分 子 、 分 母 上 各 出 现 一 次 ;[1,3] 区 间 的 
数 分 子 上 出 现 一 次 而 分 母 上 出 现 两 次 。 


def Cnil(n,i): 
if not (isinstance(n,int) and isinstance(i,int) and n>=i): 
print ('n and i must be integers and n must be larger than or equal to i.') 
return 
result=1 
Min, Max=min(i,n-i), max(i,n-i) 
for i in range(n,0,-1): 
if i>Max: 
result * =i 
elif i<=Min: 
result /=i 
return result 


print (Cnil (6,2)) 
当然 ,也 可 以 使 用 math 库 中 的 阶乘 函数 直接 按 组 合 数 定义 实现 。 


>>>def Cni2(n, i): 
import math 
return int (math. factorial (n) /math. factorial (i) /math. factorial (n-i)) 
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>>> Cni2(6,2) 
15 


还 可 以 直接 使 用 Python 标准 库 itertools 提供 的 函数 。 


>>> import itertools 
>>> len (tuple (itertools.combinations (range (60) ,2))) 
1770 


计算 组 合 数 时 如 果 数 值 n 和 i 较 大 ,建议 使 用 前 面 定 义 的 Cnil O 函数 ,不 建议 使 用 
combinations() 和 Cni2() 函 数 ,因为 这 会 增加 大 量 的 额外 操作 甚至 导致 死机 。combinations() 
更 多 的 时 候 是 用 来 返回 迭代 对 象 进行 惰性 求 值 ,而 不 是 像 上 面 代码 所 演示 的 用 法 。 除 了 
combinations() 图 数 ,itertools 还 提供 了 排列 函数 permutations()、 用 于 循环 遍历 可 和 迭代 对 
象 元 素 的 函数 cycle() ,根据 一 个 序列 的 值 对 男 一 个 序列 进行 过 滤 的 函数 compress O AR A 
也 数 返回 值 对 序列 进行 分 组 的 函数 groupby() 。 


>>> import itertools 
>>>x= 'Private Key' 
>>> y= itertools.cycle (x) # 循 环 遍历 序列 中 的 元 素 
>>> for i in range (20) : 

print (next (y), end=',') 
P,x,i,v,a,t,e, ,K,e,y,P,r,i,v,a,t,e, Ky 
>>> for i in range(5): 

print (next (y), end=',') 
EYP tris 
>>> x= range (1, 20) 
>>> y= (1,0) * 9+ (1,) 


>>>y 
(1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1) 
>>> list (itertools.compress (x, y)) # 根 据 一 个 序列 的 值 对 另 一 个 序列 进行 过 滤 


[1, 3, 5, 7, 9, 11, 13, 15, 17, 19] 
>>>def group (v) : 
if v>10: 
return "greater than 10' 
elif v<5: 
return "less than 5' 
else: 
return "between 5 and 10" 
>>> x= range (20) 
>>> y=itertools.groupby (x, group) # 根 据 函数 返回 值 对 序列 元 素 进行 分 组 
>>> for k, v in y: 
print(k, ':', list(v)) 
less than 5 : [0, 1, 2, 3, 4] 
between 5 and 10: [5, 6, 7, 8, 9, 10] 
greater than 10: [11, 12, 13, 14, 15, 16, 17, 18, 19] 
>>> List (itertools.permutations([1, 2, 3, 4], 3)) $M 4 个 元 素 中 任 选 3 个 的 所 有 排列 
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输出 结果 略 ) 

>>>x=itertools.permutations([1,2,3,4], 4) #4 个 元 素 全 排列 
>>> next (x) 

(1, 2, 3, 4) 

>>> next (x) 

(1, 2, 4, 3) 

>>> next (x) 

(1, 3, 2, 4) 


例 3-16 编写 程序 ,计算 理财 产品 收益 。 
理财 产品 比 定 期 存款 的 周期 短 , 利 息 和 本 金 一 起 滚动 ,不 同 于 定期 存款 收益 的 计算 
方法 。 
def licai (base, rate, days): 
# 初 始 投资 金额 
result=base 
# 整 除 , 用 来 计算 一 年 可 以 滚动 多 少 期 
times=365//days 
for i in range (times) : 
result= result + result * rate/365* days 


return result 


#14 天 理财 ,利率 为 0.0385, 投 资 10 万 
print (licai (100000, 0.0385, 14)) 


本 章 小 结 


(1) 几乎 所 有 合法 的 Python 表达 式 都 可 以 作为 选择 结构 和 循环 结构 中 的 条 件 表达 式 。 

(2) Python 的 关系 运算 符 可 以 连续 使 用 ,例如 ,3 二 4 二 5 二 2 的 值 为 True, 

(3) 数字 0、0.0、0j、 逻 辑 假 False、 空 列表 [] 、 空 集合 或 空 字典 {》, 空 元 组 ()、 空 字符 串 ”、 
空 值 None 以 及 任意 与 这 些 值 等 价 的 值 作 为 条 件 表 达 式 时 均 被 认为 条 件 不 成 立 ,否则 认为 


条 件 表达 式 成 立 。 
(4) 逻辑 运算 符 and 和 or 具有 短路 求 值 或 惰性 求 值 特点 , 即 只 计算 必须 计算 的 表达 式 
的 值 。 


(5) 选择 结构 和 循环 结构 往往 会 互相 骨 套 使 用 来 实现 复杂 的 业务 逻辑 。 

(6) 关键 字 elif 表示 else if 的 意思 。 

(7) 应 优先 考虑 使 用 for 循环 ,尤其 是 列表 、 元 组 .字典 或 其 他 Python 序列 元 素 遍历 的 
场合 。 
(8) 编写 循环 语句 时 ,应 尽量 减少 内 循环 中 的 无 关 计算 ,对 循环 进行 必要 的 优化 。 

(9) for 循环 和 while 循环 都 可 以 带 有 else 子 句 ,如 果 循 环 因为 条 件 表达 式 不 满足 而 自 
然 结 束 时 ,执行 else 子 句 中 的 代码 ;如 果 循环 是 因为 执行 了 break 语句 而 结束 , 则 不 执行 
else 子 句 中 的 代码 。 

(10) break 语句 用 来 提前 结束 其 所 在 循环 ,continue 语句 用 来 提前 结束 本 次 循环 并 进 
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入 下 一 次 循环 。 
(11) 除非 break 和 continue 语句 可 以 让 代码 变 得 更 简单 或 更 清晰 ,否则 不 要 轻易 
使 用 。 


J 题 


1. ADOT ARIZ AFF or 的 短路 求 值 特性 。 

2. 编写 程序 ,运行 后 用 户 输入 4 位 整数 作为 年 份 ,判断 其 是 否 为 闽 年 。 如 果 年 份 能 被 
400 整除 , 则 为 半年 ;如 果 年 份 能 被 4 整除 但 不 能 被 100 整除 也 为 头 年 。 

3. Python 提供 了 两 种 基本 的 循环 结构 : 和 

4. 编写 程序 ,生成 一 个 包含 50 个 随机 整数 的 列表 ,然后 删除 其 中 所 有 奇数 (提示 : 从 后 
向 前 删 ) 。 

5. 编写 程序 ,生成 一 个 包含 20 个 随机 整数 的 列表 ,然后 对 其 中 偶数 下 标的 元 素 进 行 降 
序 排列 ,奇数 下 标的 元 素 不 变 (提示 : 使 用 切片 ) 。 

6. 编写 程序 ,用 户 从 键盘 输入 小 于 1000 的 整数 ,对 其 进行 因 式 分 解 。 例 如 ,10 二 2X5， 
60=2X2X3X5。 

7. 编写 程序 ,至 少 使 用 两 种 不 同 的 方法 计算 100 以 内 所 有 奇数 的 和 。 

8. 编写 程序 ,输出 所 有 由 1、2、3、4 这 四 个 数字 组 成 的 素数 ,并 且 在 每 个 素数 中 每 个 数 
字 只 使 用 一 次 。 

9. 编写 程序 ,实现 分 段 函 数 计算 ,如 表 3-1 所 示 。 

表 3-1 分 段 函数 计算 


工 x 
a<0 0 
0<zx<5 z 
5<2<10 32-5 
10<2r<20 0. 5z 一 2 
20 委 zx 0 


选择 与 循环 


第 4 章 字符 串 与 正则 表达 式 


最 早 的 字符 串 编码 是 美国 标准 信息 交换 码 ASCII, 仅 对 10 个 数字 、26 个 大 写 英 文字 
母 .26 个 小 写 英文 字母 及 一 些 其 他 符号 进行 了 编码 。ASCII 采用 1 个 字 节 来 对 字符 进行 编 
码 , 因 此 最 多 只 能 表示 256 个 符号 。 

随 着 信息 技术 的 发 展 和 信息 交换 的 需要 ,各 国 的 文字 都 需要 进行 编码 ,于 是 分 别 设计 了 
不 同 的 编码 格式 ,并 且 编 码 格式 之 间 有 着 较 大 的 区 别 ,其 中 常见 的 编码 有 UT F-8 .GB2312, 
GBK、CP936 等 。 采 用 不 同 的 编码 格式 意味 着 不 同 的 表示 和 存储 形式 ,把 同一 字符 存 人 文 
件 时 , 写 入 的 内 容 可 能 会 不 同 , 在 理解 其 内 容 时 必须 了 解 编码 规则 并 进行 正确 的 解码 。 其 
中 ,UTF-8 编码 是 国际 通用 的 编码 ,以 1 个 字 节 表示 英语 字符 (兼容 ASCID ,以 3 个 字 节 表 
示 中 文 及 其 他 语言 ,UTF-8 对 全 世界 所 有 国家 需要 用 到 的 字符 进行 了 编码 。 

GB2312 是 我 国 制定 的 中 文 编码 标准 ,使 用 1 个 字 节 表示 英语 ,2 个 字 节 表示 中 文 ;GBK 
是 GB2312 的 扩充 ,而 CP936 是 微软 公司 在 GBK 基础 上 开发 的 编码 方式 。GB2312、GBK 
和 CP936 都 是 使 用 2 个 字 节 表示 中 文 ,UTF-8 使 用 3 个 字 节 表示 中 文 。 在 众多 编码 方案 
中 ,Unicode 是 不 同 编码 格式 之 间 互 相 转换 的 基础 。 

在 Windows 平台 上 使 用 Python 2. x 时 ,inputO 〇 函数 从 键盘 输入 的 字符 串 默 认为 GBK 
编码 ,而 Python 程序 中 的 字符 串 编 码 则 使 用 # coding 显 式 地 指定 ,常用 的 方式 有 : 

#coding=utf-8 

#coding:GBK 

#- * -coding:utf- 8 - * - 

Python 2. x 对 中 文 支持 不 够 ,因此 常常 需要 在 不 同 的 编码 之 间 互 相 转 换 , 例 如 ,下 面 是 
Python 2.7. 11 环境 执行 的 结果 : 


>>> sl= "中 国 ' 2 

>>> sl >>> 33=s2.encode ('UTF- 8') 
"\xdé\xd0\xb9\xfa" >>> s3 

>>> len(s1) "\xe4\ xb8\ xad\ xe5\ x9b\ xbd' 
4 >>> len(s3) 

>>> s2= s1.decode ('GBK') 6 

>>> s2 >>> print sl, s2, s3 
u'\u4e2d\u56fd' 中 国 中 国 中 国 


>>> len (s2) 


Python 3. x 中 则 完全 支持 中 文 ,无论 是 一 个 数字 、 英 文字 母 , 还 是 一 个 汉字 ,都 按 一 个 
字符 对 待 和 处 理 。 例 如 在 Python 3. 5. 1 环境 中 执行 下 面 的 代码 ,从 代码 中 可 以 看 到 ,在 
Python 3. x 中 甚至 可 以 使 用 中 文 作为 变量 名 。 
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>>> s= ' 中 国 山东 烟台 ' i 

>>> len (s) >>> 姓名 = ' 张 三 ' 
6 >>> 年 龄 = 40 
>>> s='SDIBT' >>> print (姓名 ) 
>>> len(s) 张 三 

5 >>> print (年 龄 ) 
>>> s= ' 中 国 山 东 烟台 SDIBT' 40 

>>> len(s) 


41 F 符 R 


在 Python 中 ,字符 串 属于 不 可 变 序 列 类 型 ,使 用 单 引号 、 双 引号 、 三 单 引号 或 三 双 引 号 
作为 界定 符 ,并 且 不 同 的 界定 符 之 间 可 以 互相 嵌 套 。 除 了 支持 序列 通用 方法 (包括 比较 `. 计 
算 长 度 \ 元 素 访问 、 分 片 等 操作 ) 以 外 ,字符 串 类 型 还 支持 一 些 特有 的 操作 方法 ,例如 ,格式 化 
操作 字符 串 查找 字符 串 替 换 等 。 但 由 于 字符 串 属于 不 可 变 序 列 , 不 能 对 字符 串 对 象 进行 
元 素 增加 、 修 改 与 删除 等 操作 。 字 符 串 对 象 提供 的 replace) Al translate( ) 方 法 并 不 是 对 原 
字符 串 直 接 修改 其 换 ,而 是 返回 一 个 修改 鞭 换 后 的 结果 字符 串 。 

Python 支持 字符 串 驻 留 机 制 , 即 : 对 于 短 字 符 串 ,将 其 赋值 给 多 个 不 同 的 对 象 时 ,内 存 
中 只 有 一 个 副本 ,多 个 对 象 共享 该 副本 。 这 一 点 不 适用 于 长 字符 串 , 即 长 字符 串 不 遵守 驻 留 
机 制 , 下 面 的 代码 演示 了 短 字 符 串 和 长 字符 串 在 这 方面 的 区 别 。 

>>> a= '1234' 

>>> b= '1234' 

>>> id(a)==id (b) 

True 

>>> a= '1234' * 50 

>>> b= '1234' * 50 

>>> id(a)==id (b) 


False 

在 Python 2.x 中 ,字符 串 有 str 和 unicode 两 种 ,其 基 类 都 是 basestring, YE Python 3. x 
中 合 二 为 一 了 ,只 提供 str 类 型 。 在 Python 3. x 中 ,程序 源 文件 默认 为 UTF-8 编码 ,全面 支 
持 中 文 , 字 符 串 对 象 不 再 decode() 方 法 。 


>>>type(' 中 国 ') # Python 2.7.11 False 
<type 'str'> >>>type(' 中 国 ') #Python 3.5.1 
>>>type(' 中 国 '.decode('gbk')) <class 'str'> 

<type 'unicode'> >>> type ("H H ' .encode ('gbk')) 
>>> isinstance ('abcd', str) <class 'bytes'> 

True >>>bytes 

>>>isinstance(' 中 国 ', basestring) <class 'bytes'> 

True >>>isinstance(' 中 国 ',， str) 
>>> isinstance ('abcd', unicode) True 


《Python 程序 设计 (第 2 版 )》 ERE 


4.1.1 字符 串 格式 化 


如 果 需 要 将 其 他 类 型 数据 转换 为 字符 串 或 另 一 种 数字 格式 ,或 者 嵌入 其 他 字符 串 或 模 
板 中 再 进行 输出 ,就 需要 用 到 字符 串 格式 化 。Python 中 字符 串 格式 化 的 格式 如 图 4-1 所 
示 ,% 符 号 之 前 的 部 分 为 格式 字符 串 ,之 后 的 部 分 为 需要 进行 格式 化 的 内 容 。 
'% 中 TH [0] fm) Ln) 格式 字符 % x 


t {ay 待 转换 的 表达 式 
(2) 格式 运算 符 
(3) 指定 类 型 ， 见 表 4-1 
(4) 指定 精度 
(5) 指定 最 小 宽度 
(6) 指定 空位 填 0 
(D 对 正 数 加 正 号 
(8) 指定 左 对 齐 输出 
(9) 格式 标志 ， 表 示 格 式 开始 


图 4-1 字符 串 格式 化 


与 其 他 语言 一 样 ,Python 支持 大 量 的 格式 字符 ,常见 的 格式 字符 如 表 4-1 所 示 。 


表 4-1 格式 字符 
格式 字符 说 å 格式 字符 说 明 
%s 字符 串 〈 采 用 str() 的 显示 ) %x 十 六 进 制 整数 
%r 字符 串 〈 采 用 repr() 的 显示 ) %e 指数 (基底 写 为 e) 
“c 单个 字符 %E 指数 (基底 写 为 E) 
%b 二 进 制 整数 %f、%F | 浮 点 数 
%d 十 进 制 整数 %%g 指数 (e) 或 浮 点 数 (根据 显示 长 度 ) 
%i 十 进 制 整数 %G 指数 (E) 或 浮 点 数 (根据 显示 长 度 ) 
%o 八进制 整数 %% 字符 "%" 


下 面 的 代码 简单 演示 了 字符 串 格式 化 的 用 法 : 


>>> x= 1235 

>>> so="%O" Bx 

>>> so 

s23" 

>>> sh="%x" $x 

>>> sh 

nad3" 

>>> se="%e" $x 

>>> se 

"1.235000e+ 03" 

>>> chr (ord ("3")+ 1) 
ngn 

>>> "Ss"S65 # 类 似 于 str() 


一 一 | 交 
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weno 
>>> "$s"S65333 

"65333" 

>>> 'Sd,%c'S (65, 65) # 使 用 元 组 对 字符 串 进 行 格式 化 , 按 位 置 对 应 

"65,A" 

>>> "%d"%"555" # 试 图 将 字符 串 转换 为 整数 进行 输出 , 抛 出 异常 
TypeError: %d format: a number is required, not str 

>>> int ("555") # 可 以 使 用 int () 函 数 将 合法 的 数字 字符 串 转换 为 整数 
555 


>>> 'Ss'S[1, 2, 3] 

'[, 2, 3)" 

>>> str((1, 2, 3)) # 可 以 使 用 str () 函 数 将 任意 类 型 数据 转换 为 字符 串 
"(1, 2, 3)" 

>>> str([1, 2, 3]) 

"(1, 2, 3]' 


目前 Python 社区 更 推荐 使 用 format() 方 法 进行 格式 化 ,该 方法 更 加 灵活 ,不 仅 可 以 使 
用 位 置 进行 格式 化 ,还 支持 使 用 与 位 置 无 关 的 参数 名 字 来 进行 格式 化 ,并 且 支 持 序列 解 包 格 
式 化 字符 串 ,为 程序 员 提 供 了 非常 大 的 方便 。 例 如 : 


>>> print ("The number {0:,} in hex is: {0:#x}, the number {1} in oct is {1:#0}". format (5555, 
55)) 
The number 5,555 in hex is: 0x15b3, the number 55 in oct is 0067 
>>> print ("The number {1:,} in hex is: {1:#x}, the number {0} in oct is {0:#0)". format (5555, 
55)) 
The number 55 in hex is: 0x37, the number 5555 in oct is 0012663 
>>> print ("my name is {name}, my age is {age}, and my QQ is {qq}".format (name= "Dong Fuguo", qq 
="306467355", age= 37)) 
my name is Dong Fuguo, my age is 37, and my QQ is 306467355 
>>> position= (5, 8, 13) 
>>> print ("X:{0[0] };Y:{0[1] };Z:{0[2] }".format (position)) 
X:5;¥:8;2:13 
>>> weather= [("Monday", "rain"), ("Tuesday", "sunny"), 
("Wednesday", "sunny"), ("Thursday", "rain"), 
("Friday", "Cloudy") ] 
>>> formatter= "Weather of '{0[0]}" is '{0[1]}'".format 
>>> for item in map(formatter, weather): 
print (item) 
Weather of 'Monday' is 'rain' 
Weather of 'Tuesday' is 'sunny’ 
Weather of 'Wednesday' is 'sunny' 
Weather of 'Thursday' is 'rain' 
Weather of 'Friday' is 'Cloudy' 


关于 内 置 函数 map() 的 介绍 可 以 参考 5. 8 节 的 介绍 。 上 面 最 后 一 段 代码 也 可 以 改 为 下 
面 的 写法 : 
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>>> for item in weather: 


print (formatter (item) ) 


4.1.2 字符 串 常用 方法 


字符 串 是 非常 重要 的 数据 类 型 ,Python 提供 了 大 量 的 函数 支持 字符 串 操 作 。 本 节 通 过 
大 量 示例 来 演示 部 分 函数 的 用 法 ,可 以 使 用 dir("") 查 看 所 有 字符 串 操作 函数 列表 ,并 使 用 
内 置 函数 helpO 〇 查看 每 个 函数 的 帮助 。 因 为 字符 串 也 是 Python 序列 的 一 种 ,除了 本 节 介 
绍 的 字符 串 处 理 函 数 , 很 多 Python 内 置 函数 也 支持 对 字符 串 的 操作 ,例如 用 来 计算 序列 长 
BEW len() 方 法 , 求 最 大 值 的 max() 方 法 ,等 等 。 

1. find() \rfind© index() .rindex() ,count() 

find All rfind() 方 法 分 别 用 来 查找 一 个 字符 串 在 另 一 个 字符 串 指定 范围 (默认 是 整个 
字符 串 ) 中 首次 和 最 后 一 次 出 现 的 位 置 ,如 果 不 存在 则 返回 一 1;index() 和 rindex() 方 法 用 
来 返回 一 个 字符 串 在 另 一 个 字符 串 指定 范围 中 首次 和 最 后 一 次 出 现 的 位 置 , 如 果 不 存 在 则 
抛 出 异常 ;count() 方 法 用 来 返回 一 个 字符 串 在 另 一 个 字符 串 中 出 现 的 次 数 。 


>>> s= "apple, peach, banana, peach, pear" 


>>> s.find ("peach") # 返 回 第 一 次 出 现 的 位 置 
6 

>>> s.find("peach"，7) # 从 指定 位 置 开 始 查找 
19 


>>> s.find("peach", 7, 20) # 在 指定 范围 中 查找 
>i 


>>> s.rfind('p') # 从 字符 串 尾 部 向 前 查找 
25 
>>> s.index('p') # 返 回首 次 出 现 位 置 


1 

>>> s.index('pe') 

6 

>>> s.index ('pear') 

25 

>>> s.index ("ppp") # 指 定子 字符 串 不 存在 时 抛 出 异常 
ValueError: substring not found 

>>> s.count ("p') # 统 计 子 字符 串 出 现 次 数 
5 

>>> s.count ("pp") 

1 

>>> s.count ("ppp") 

0 


2. split() .rsplit() .partition( ) .rpartition( ) 

split() 和 rsplit() 方 法 分 别 用 来 以 指定 字符 为 分 隔 符 , 从 字符 串 左 端 和 右 端 开始 将 其 分 
割 成 多 个 字符 串 , 并 返回 包含 分 割 结 果 的 列表 ;partition() 和 rpartition() 用 来 以 指定 字符 串 
为 分 隔 符 将 原 字符 串 分 割 为 3 部 分 , 即 分 隔 符 前 的 字符 串 、 分 隔 符 字符 串 、 分 隔 符 后 的 字符 
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R ,如 果 指 定 的 分 隔 符 不 在 原 字 符 串 中 , 则 返回 原 字符 串 和 两 个 空 字符 串 。 


>>> s="apple, peach, banana, pear" 
>>> li=s.split(",") +E ESB 
>>> li 

["apple", "peach", "banana", "pear"] 
>>> s.partition(',') 

(‘apple', ',', "peach,banana,pear') 
>>> s.rpartition(',') 
("apple,peach,banana', ',', 'pear') 
>>> s.rpartition ('banana') 
('apple,peach,', 'banana', ',pear') 
>>> s="2014- 10- 31” 

>>> t=s.split ("-") 

>>>t 

['2014", "10", "31"] 

>>> list (map (int, t)) 

(2014, 10, 31] 


对 于 splitO Al rsplit() 方 法 ,如 果 不 指定 分 隔 符 , 则 字符 串 中 的 任何 空白 符号 (包括 空 


格 .换行 符 、 制 表 符 等 ) 都 将 被 认为 是 分 隔 符 , 返 回 包含 最 终 分 割 结 果 的 列表 。 


>>> s='\n\nhello\t\t world \n\n\n My name\t is Dong ' 
>>> s.split() 


['hello', 'world', 'My', 'name', 'is', 'Dong'] 
split() 和 rsplit() 方 法 还 允许 指定 最 大 分 割 次 数 ,例如 : 


>>> s='\n\nhello\t\t world \n\n\n My name is Dong ' 
>>> s.split (None, 2) 

["hello', 'world', 'My name is Dong t i 

>>> s.rsplit (None, 2) 

['\n\nhello\t\t world \n\n\n My name', 'is', 'Dong'] 
>>> s.split (None, 6) 


['hello', 'world', 'My', 'name', 'is', 'Dong'] 


3. join() 
与 split() 相 反 ,join() 方 法 用 来 将 列表 中 多 个 字符 串 进 行 连接 ,并 在 相 邻 两 个 字符 串 之 


间 插 入 指定 字符 。 


>>> li=["apple", "peach", "banana", "pear"] 
>>> sep="," 

>>> s=sep.join (li) 

>>> s 


"apple,peach,banana,Pearn 


使 用 运算 符 “ 十 ”也 可 以 连接 字符 串 ,但 效率 较 低 ,应 优先 使 用 join() 方 法 。 下 面 的 


Python 3. 5. 1 代码 演示 了 二 者 之 间 速 度 的 差异 。 
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import timeit 


strlist=['This is a long string that will not keep in memory." for n in range (100) ] 


def use join(): 


return '' 


.join (strlist) 
def use plus() : 
result='' 
for strtemp in strlist: 
result= result+ strtemp 


return result 


if name - 
times=1000 
jointimer=timeit.Timer('use join()', 'from main import use_join') 
print ('time for join:', jointimer.timeit (number=times)) 
plustimer=timeit.Timer('use_plus()', 'from main _ import use plus') 


Print('time for plus:', plustimer.timeit (number=times)) 


上 面 代码 使 用 timeit 模块 的 Timer 类 对 代码 运行 时 间 进 行 测试 。 另 外 ,该 模块 还 支持 
下 面 代码 演示 的 用 法 。 


>>> import timeit 

>>> timeit.timeit ('"-".join (str (n) for n in range (100))', number= 10000) 
0.6054277848162267 

>>> timeit.timeit ('"-".join([str (n) for n in range (100) ])', number= 10000) 
0.5314926897133567 

>>> timeit.timeit ('"-".join (map (str, range (100)))', number= 10000) 
0.33093395948368 


4. lower() ,upper() .capitalize() \title() .swapcase() 
这 儿 个 方法 分 别 用 来 将 字符 串 转换 为 小 写 、 大 写字 符 串 、 将 字符 串 首 字母 变 为 大 写 、 将 
每 个 单词 的 首 字母 变 为 大 写 以 及 大 小 写 互 换 。 


>>> s= "What is Your Name?" 
>>> s2=s.lower() 
>>> 82 

"what is your name?" 
>>> s.upper () 

"WHAT IS YOUR NAME?" 
>>> s2.capitalize() 
"What is your name?" 
>>> s.title() 

"What Is Your Name?" 
>>> s.swapcase () 
"wHAT IS yOUR nAME?' 
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5. replace() 
PTT RE FR KFR PA BE EE SE ES SOT A BSB BR 
符 或 一 个 子 字符 串 。 


>>> s= "中 国 , 中 国 " 

>>> print (s) 

中 国 ,中 

>>> s2=s.replace ("中 国 ", "中 华人 民 共 和 国 ") 
>>> print (s2) 


中 华人 民 共 和 国 , 中 华人 民 共 和 国 


6. maketrans() ,translate() 

maketrans() 方 法 用 来 生成 字符 映射 表 , 而 translate() 方 法 则 按 映射 表 关 系 转换 字符 串 
并 替换 其 中 的 字符 ,使 用 这 两 个 方法 的 组 合 可 以 同时 处 理 多 个 不 同 的 字符 ,replace() 方 法 则 
无 法 满足 这 一 要 求 。 下 面 的 代码 演示 了 这 两 个 方法 的 用 法 ,当然 还 可 以 定义 自己 的 字符 映 
射 表 ,然后 用 来 对 字符 串 进 行 加 密 。 


# 将 字符 "abcdef123" 一 一 对 应 地 转换 为 "uvwxyz@ #$" 

>>> table= '' .maketrans ("abcdef123", "uvwxyz@ #$") 

>>> s="Python is a greate programming language. I like it!" 
>>> s.translate (table) 

"Python is u gryuty progrumming lunguugy. I liky it!" 


7. strip rstrip() ,lstrip() 
这 几 个 方法 分 别 用 来 删除 两 端 ` 右 端 或 左 端的 空白 字符 或 连续 的 指定 字符 。 


>>> s=" abc " 

>>> s2=s.strip() # 删 除 空白 字符 

>>> 32 

Mabe" 

>>> '"\n\nhello world \n\n'.strip() # 删 除 空白 字符 

"hello world" 

>>> "aaaassddf£".strip ("a") # 删 除 指定 字符 

"ssddf" 

>>> "aaaassddf".strip ("af") 

"ssdd" 

>>> "aaaassddfaaa".rstrip ("a") # 删 除 字符 串 右 端 指 定 字符 
"aaaassddf' 

>>> "aaaassddfaaa".1strip ("a") # 删 除 字符 串 左 端 指定 字符 


"ssddfaaa" 


8. eval() 
内 置 函 数 eval 〇 尝试 把 任意 字符 串 转 化 为 Python 表达 式 并 求 值 。 
>>> eval ("3+ 4") 


7 
>>> a=3 
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>>>b=5 
>>> eval ('atb') 
8 
>>> import math 
>>> eval ("help (math. sqrt) ') 
Help on built-in function sqrt in module math: 
sqrt (...) 

sqrt (x) 
Return the square root of x. 
>>> eval ('math.sqrt (3) ') 
1.7320508075688772 
>>> eval ('aa') 


NameError: name "aa' is not defined 


使 用 eval() 时 要 注意 的 一 个 问题 是 , 它 可 以 计算 任意 合法 表达 式 的 值 ,如 果 用 户 巧妙 
地 构造 输入 的 字符 串 , 可 以 执行 任意 外 部 程序 ,例如 ,下 面 的 代码 运行 后 可 以 启动 记事 本 
程序 : 


>>> a= input ("Please input:") 
Please input: import ('o0s').startfile(r'C:\Windows\notepad. 
exe') 


>>> eval (a) 


再 执行 下 面 的 代码 试 试 ,然后 看 看 当前 工作 目录 中 多 了 什么 。 当 然 还 可 以 调用 命令 来 
删除 这 个 文件 夹 或 其 他 文件 ,或 者 精心 构造 其 他 字符 串 来 达到 特殊 目的 。 


>>> eval("__import__('os') .system('md testtest')") 


9. 关键 字 in 
与 列表 元 组 .字典 、 集 合 一 样 ,也 可 以 使 用 关键 字 in 和 not in 来 判断 一 个 字符 串 是 否 
出 现在 另 一 个 字符 串 中 ,返回 True 或 False. 


>>> "a" in "abcde" 
True 
>>> "ab' in 'abcde' 
True 
>>> "j" in "abcde" 


False 

10. startswith() .endswith( ) 

这 两 个 方法 用 来 判断 字符 串 是 否 以 指定 字符 串 开 始 或 结束 。 这 两 个 方法 可 以 接收 两 个 
整数 参数 来 限定 字符 串 的 检测 范围 ,例如 : 


>>> s= "Beautiful is better than ugly.' 
>>> s.startswith ('Be') 

True 

>>> s.startswith ('Be', 5) 

False 


— 


母 , 小 写字 母 等 ,用 户 可 以 直接 使 用 这 些 常 量 。 下 面 的 代码 在 Python 2.7.8 中 运 
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>>> s.startswith("Be', 0, 5) 


True 


男 外 ,这 两 个 方法 还 可 以 接收 一 个 字符 串 元 组 作为 参数 来 表示 前 组 或 后 级 ,例如 ,下 面 


的 代码 可 以 列 出 指定 文件 夹 下 所 有 扩展 名 为 bmp jpg 或 gif 的 图 片 。 


>>> import os 

>>> [filename for filename in os.listdir(r'D:\\') if filename.endswith 
(('.bmp', '.jpg', '-gif'))] 

11. isalnum() isalpha() ,isdigit() ,isspace( ) ,isupper() .islower() 


用 来 测试 字符 串 是 否 为 数字 或 字母 .是否 为 字母 .是 否 为 数字 字符 ,是否 为 空白 字符 .是 


和 否 为 大 写字 母 以 及 是 否 为 小 写字 母 。 


>>> '1234abcd'.isalnum() >>> 'abcd'.isalpha () 
True True 

>>> '1234abcd'.isalpha() >>> '1234.0'.isdigit () 
False False 

>>> "1234abcd' .isdigit () >>> '1234' .isdigit () 
False True 


12. center() „ljust rjust() 
返回 指定 宽度 的 新 字符 串 , 原 字符 串 居中 、 左 对 齐 或 右 对 齐 出 现在 新 字符 串 中 ,如 果 指 


定 的 宽度 大 于 字符 串 长 度 , 则 使 用 指定 的 字符 (默认 为 空格 ) 填 充 。 


>>> 'Hello world!'.center (20) 
a Hello world! S 


>>> 'Hello world!'.center (20, '=') 
'====Hello world!====' 

>>> 'Hello world!'.ljust (20, '=') 
'Hello world!= 


>>> 'Hello world!'.rjust (20, '=') 


t ==Hello world!' 


4.1.3 字符 串 常量 


在 string 模块 中 定义 了 多 个 字符 串 常量 ,包括 数字 字符 、 标 点 符号 .英文 字母 ,大 写字 
行 ， 


>>> import string 


>>> string.digits # 数 字 字 符 常量 

'0123456789" 

>>> string.punctuation # 标 点 符号 常量 

"ims SEN (x+ 一 -Ai<=>2 @ III € 

>>> string.letters # 英 文字 母 常量 
'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz' 
>>> string.printable # 可 打印 字符 
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*0123456789abcdefghi j klmnopgrstuvwxyzABCDEFGHIJKLMNOPORSTUVWXYZ!"#$ %6\'() * +,—./27<=>? 
@ AW \t\n\r\x0b\x0c" 

>>> string. lowercase # 小 写字 母 

"abcdefghijklmnopqrstuvwxyz' 

>>> string.uppercase # 大 写字 母 

* ABCDEFGHIJKLMNOPQRSTUVWXYZ' 


下 面 的 Python 3. 5. 1 代码 演示 了 8 位 长 度 随机 密码 生成 算法 的 原理 。 


>>> import string 

>>> x= string.digitst string.ascii letterst string.punctuation 
>>> import random 

>>> ''.join([random.choice (x) for i in range (8) ]) 

"(Crz[44M" 

>>> ''. join (random. sample (x, 8) ) 

‘o_2(M>iF" 


random 是 与 随机 数 有 关 的 Python 标准 库 , 除 了 用 于 从 序列 中 任意 选择 一 个 元 素 的 函 
数 choice() ,random 还 提供 了 用 于 生成 指定 二 进 制 位 数 的 随机 整数 的 函数 getrandbits()、 
生成 指定 范围 内 随机 数 的 函数 randrange() 和 randint() 、 列 表 原 地 乱 序 函数 shuffle() MIF 
列 中 随机 选择 指定 数量 不 重复 元 素 的 函数 sample() 、 返 回 [0,1] 区 间 内 符合 beta 分 布 的 随 
PLAC PAA betavariate() ,符合 gamma 分 布 的 随机 数 函 数 gammavariate() ,符合 gauss 分 布 
的 随机 数 函 数 gauss() 等 ,同时 还 提供 了 SystemRandom 类 支持 生成 加 密级 别 要 求 的 不 可 
再 现 伪 随机 数 序列 。 


>>> import random 

>>> random.getrandbits (17) 
6233 

>>> random.getrandbits (17) 
55217 

>>> x= List (range (20) ) 

>>> random. shuffle (x) 

>>>x 

[2, 16, 15, 14, 18, 3, 10, 8, 5, 12, 6, 19, 1, 9, 13, 7, 0, 4, 17, 11] 
>>> random. sample (x, 3) 
[19, 4, 14] 


下 面 的 代码 使 用 Python 标准 库 random 中 的 方法 模拟 了 发 红包 算法 。 


import random 


def hongbao (total, num): 
# total 表示 拟 发 红包 总 金额 
# num 表 示 拟 发 红包 数量 
each= [] 
# 已 发 红包 总 金额 
already=0 


一 -100 


for i in range(1, num): 
# 为 当前 抢 红 包 的 人 随机 分 配 金 额 
# 至 少 给 剩 下 的 人 每 人 留 一 分 钱 
t=random.randint (1，(total- already)- (num-i)) 
each.append (t) 
already=already+t 

FIRMA RRA a — iA 

each.append (total- already) 


return each 


if) a 
total=5 


num 5 

# 模 拟 30 次 

for i in range (30) : 
each=hongbao (total, num) 
print (each) 


4.1.4 可 变 字符 串 ” 


在 Python 中 ,字符 串 属于 不 可 变 对 象 ,不 支持 原 地 修改 ,如 果 需 要 修改 其 中 的 值 ,只 能 
新 创建 一 个 新 的 字符 串 对 象 。 然 而 ,如 果 确 实 需 要 一 个 支持 原 地 修改 的 Unicode 数据 对 
象 ,可 以 使 用 io. StringIO 对 象 或 array 模块 。 


>>> import io "Hello, there!" 

>>> s="Hello, world" >>> import array 

>>> sio= io.StringIO(s) >>> a=array.array('u', s) 
>>> sio.getvalue () >>> print (a) 

"Hello, world' array('u', 'Hello, world') 
>>> sio.seek (7) >>> a[0]='y' 

7 >>> print (a) 

>>> sio.write("there!") array('u', 'yello, world') 
6 >>> a.tounicode () 

>>> sio.getvalue() "yello, world" 


4.1.5 字符 串 应 用 案例 精 选 
例 4-1 编写 函数 实现 字符 串 加 密 和 解密 ,循环 使 用 指定 密 钥 ,采用 简单 的 异 或 算法 。 


def crypt (source，key) : 
from itertools import cycle 
result="" 
temp= cycle (key) 
for ch in source: 
result= result + chr (ord (ch) ^ ord (next (temp))) 


return result 
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source= 'Shandong Institute of Business and Technology' 
key= 'Dong Fuguo' 


print ("Before Encrypted: '+ source) 
encrypted=crypt (source, key) 

print ("After Encrypted: '+ encrypted) 
decrypted=crypt (encrypted, key) 
print ("After Decrypted: '+ decrypted) 


输出 结果 如 图 4-2 所 示 。 


Before Encrypted: Shandong Institute of Business and Technology 
After Encrypted:ie%  D)= Uke-ST3 10 “0,1S/q-aP LIH 40 oy 
After Decrypted: Shandong Institute of Business and Technology 


图 4-2 字符 串 加 密 与 解密 结果 


例 4-2 编写 程序 ,生成 大 量 随机 信息 。 
本 例 代码 演示 了 如 何 使 用 Python 标准 库 random 来 生成 随机 数据 ,这 在 需要 获取 大 量 


数据 来 测试 或 演示 软件 功能 的 时 候 非常 有 用 ,不 仅 能 真实 展示 软件 功能 或 算法 ,还 可 以 避免 
泄露 真实 数据 或 者 引起 不 必要 的 争议 。 
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import random 
import string 
import codecs 


# 常 用 汉字 Unicode 编码 表 (部 分 ), 完 整 列表 详 见 配套 源 代 码 
StringBase= '\u7684\u4e00\u4e86\u662£\u6211\u4e0d\u5728\u4eba" 
# 转 换 为 汉字 


StringBase= ''.join(StringBase.split ('\\u')) 


def getEmail(): 
# 常 见 域名 后 级 ,可 以 随意 扩展 该 列表 
suffix= ['.com', '.org', '.net', '.cn'] 
characters= string.ascii letters+ string.digits+ " ' 
username= ' .join ( (random.choice (characters) for i in range (randam.randint (6,12)))) 
domain= ''.join ((random.choice (characters) for i in range (random. randint (3, 6)))) 


return username+ '@ '+domain+ random.choice (suffix) 


def getTelNo(): 


return ''.join((str(random.randint (0,9)) for i in range(11))) 


def getNameOrAddress (flag) : 
"flag=1 表 示 返 回 随机 姓名 ,flag=0 表 示 返 回 随 机 地 址 " 
result="" 
if flag==1: 
# 大 部 分 中 国人 姓名 在 2~ 4 个 汉字 


rangestart, rangeend=2, 5 


elif flag==0: 
# 假 设 地 址 在 10~ 30 个 汉字 之 间 
rangestart, rangeend=10, 31 
else: 
print ('flag must be 1 or 0') 
return '' 
for i in range (random. randint (rangestart, rangeend)): 
result +=random.choice (StringBase) 


return result 


def getSex(): 


return random.choice(("H', '&')) 


def getAge(): 


return str (random. randint (18, 100) ) 


def main (filename) : 


with codecs.open(filename, 'w', 'utf-8"') as fp: 
fp.write ('Name, Sex, Age, TelNO, Address, Email\n') 
# 随机 生成 200 人 的 信息 
for i in range(200): 
name= getNameOrAddress (1) 
sex= getSex () 
age= getAge () 
tel= getTelNo () 
address= getNameOrAddress (0) 
email=getEmail () 
line=name +',' +sex+',' tage +',' +tel +',' taddress +',' +email +'\n' 


fp.write (line) 


def output (filename) : 


if a 


with codecs.open (filename, 'r', 'utf-8') as fp: 
while True: 
line= fp.readline () 
if not line: 
return 
line=line.split (',') 
for i in line: 


print (i, end=',') 


print () 


filename='information.txt' 
main (filename) 


output (filename) 
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4.2 正则 表达 式 


正则 表达 式 是 字符 串 处 理 的 有 力 工具 和 技术 ,正则 表达 式 使 用 预定 义 的 特定 模式 去 匹 
配 一 类 具有 共同 特征 的 字符 串 ,主要 用 于 字符 串 处 理 , 可 以 快速 .准确 地 完成 复杂 的 查找 、 蔡 
换 等 处 理 要 求 。 

Python 中 ,re 模块 提供 了 正则 表达 式 操作 所 需要 的 功能 。 本 节 首 先 介绍 正则 表达 式 的 
基础 知识 ,然后 介绍 re 模块 提供 的 正则 表达 式 函 数 与 对 象 的 用 法 。 


4.2.1 


正则 表达 式 语 法 


正则 表达 式 由 元 字符 及 其 不 同 组 合 来 构成 ,通过 巧妙 地 构造 正则 表达 式 可 以 匹配 任意 
字符 串 , 并 完成 复杂 的 字符 串 处 理 任务 。 常 用 的 正则 表达 式 元 字符 如 表 4-2 所 示 。 


表 4-2 正则 表达 式 常 用 元 字符 
功能 说 明 


匹配 除 换行 符 以 外 的 任意 单个 字符 


匹配 位 于 * 之 前 的 字符 或 子 模式 的 0 次 或 多 次 出 现 


匹配 位 于 十 之 前 的 字符 或 子 模 式 的 1 次 或 多 次 出 现 


用 在 [] 之 内 用 来 表示 范围 


匹配 位 于 | 之 前 或 之 后 的 字符 


匹配 行 首 ,匹配 以 ^ 后 面 的 字符 开头 的 字符 串 


匹配 行 尾 ,匹配 以 $ 之 前 的 字符 结束 的 字符 串 


匹配 位 于 “?” 之 前 的 0 个 或 1 个 字符 。 当 此 字符 紧 随 任何 其 他 限定 符 (* 十,?、{n})、 
{n,)、{n,m)) 之 后 时 ,匹配 模式 是 “ 非 贪 心 的 ”"。“ 非 贪心 的 "模式 匹配 搜索 到 的 、 尽 可 能 短 
的 字符 串 , 而 默认 的 “贪心 的 "模式 匹配 搜索 到 的 、 尽 可 能 长 的 字符 串 。 例 如 ,在 字符 串 
“0000” 中 ,“o 十 ?” 只 匹配 单个 0, 而 o HL EC ATA o 


表示 位 于 \ 之 后 的 为 转 义 字符 


此 处 的 num 是 一 个 正 整 数 。 例 如 ,“(. )\1” 匹 配 两 个 连续 的 相同 字符 


换 页 符 匹配 


换行 符 匹配 


匹配 一 个 回 车 符 


匹配 单词 头 或 单词 尾 


与 \b 含义 相反 


匹配 任何 数字 ,相当 于 [0-9] 


与 \d 含义 相反 ,等 效 于 [^0-9] 


匹配 任何 空白 字符 ,包括 空格 \ 制 表 符 , 换 页 符 ,与 [ \f\n\n\t\vj 等 效 


与 \s 含义 相反 
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BR 


元 字符 功能 说 明 
\w 匹配 任何 字母 .数字 以 及 下 划 线 ,相当 于 [a-zA-2Z0-9_] 
\w 与 \w 含义 相反 ,与 “[^A-Za-z0-9_]” 等 效 
oO 将 位 于 () 内 的 内 容 作 为 一 个 整体 来 对 待 
{} 按 {} 中 的 次 数 进行 匹配 
口 匹配 位 于 口中 的 任意 一 个 字符 

[^xyz] | 反 向 字符 集 , 匹 配 除 x、y、z 之 外 的 任何 字符 

[az] 字符 范围 ,匹配 指定 范围 内 的 任何 字符 

[%a-z] | 反 向 范围 字符 ,匹配 除 小 写 英文 字母 之 外 的 任何 字符 


如 果 以 “\” 开 头 的 元 字符 与 转 义 字符 相同 , 则 需要 使 用 “\\ "或 者 原始 字符 串 ,在 字符 串 
前 加 上 字符 “r" 或 “R”。 原 始 字 符 串 可 以 减少 用 户 的 输入 ,主要 用 于 正则 表达 式 和 文件 路 径 
字符 串 , 如 果 字 符 串 以 一 个 斜 线 “\” 结 束 , 则 需要 多 写 一 个 斜 线 , 以 “\\" 结 束 。 

具体 应 用 时 ,可 以 单独 使 用 某 种 类 型 的 元 字符 ,但 处 理 复杂 字符 串 时 ,经 常 需要 将 多 个 
正则 表达 式 元 字符 进行 组 合 , 下 面 给 出 了 几 个 简单 的 示例 。 

(1) 最 简单 的 正则 表达 式 是 普通 字符 串 , 可 以 匹配 自身 。 

(2) (Lpjcjython' 可 以 匹配 python'iython'、vcython'。 

(3) (ar-zA-Z0-9] 可 以 匹配 一 个 任意 大 小 写字 母 或 数字 。 

(4) 人 abc] 可 以 匹配 一 个 任意 除 a'b' ce 之 外 的 字符 。 

(5) 'python| perl'2'p(ython| erl) fb A] LA PE Ad python'sk'perl', 

(6) 子 模式 后 面 加 上 问号 表示 可 选 。r'(http://)?(wwwN. )?python\. org' 只 能 匹配 
‘http://www. python, org','‘http: //python, org','www. python, org'l'python. org’. 

(7) “http' 只 能 匹配 所 有 以 http' 开 头 的 字符 串 。 

(8) Cpattern)'* : 允许 模式 重复 0 KREK. 

(9) (pattern) +'; 允许 模式 重复 1 次 或 多 次 。 

(10) (pattern) {m, n}: 允许 模式 重复 m~n 次 。 

AD alb) * c': 匹配 多 个 (包含 0 个 )a 或 b, 后 面 紧 跟 一 个 字母 c。 

(12) ab{1,)': 等 价 于 ab 十 ,匹配 以 字母 a 开头 后 面 带 1 个 至 多 个 字母 b 的 字符 串 。 

(13) “[a-zA-Z]{1}([a-zA-2Z0-9. _]) {4.19} $': 匹配 长 度 为 5 一 20 的 字符 串 ,必须 以 字 
母 开 头 、 可 带 数字 、“_”、“. ”的 字符 串 。 

(14) “C\w) (6.20) $': 匹配 长 度 为 6 一 20 的 字符 串 ,可 以 包含 字母 .数字 .下 划 线 。 

(15) N\d{1.3}\. \d{1,3}\. \d{1,3}\. \d{1,3}$': 检查 给 定 字 符 串 是 否 为 合法 IP 
地 址 。 

(16) “(13[4-9]\d{8})1(15[L01289]\d{8)) $': 检查 给 定 字 符 串 是 否 为 移动 手机 号 码 。 

a7) “[a-zA-Z] 十 $': 检查 给 定 字符 串 是 否 只 包含 英文 字母 大 小 写 。 

(18) 和 w+@QNwt\. O Hwt $: 检查 给 定 字符 串 是 否 为 合法 电子 邮件 地 址 。 

aD ADAdE A. \d{1,2))?$': 检查 给 定 字符 串 是 否 为 最 多 带 有 2 位 小 数 的 正 数 
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或 负数 。 

(20) 和 \u4e00-\u9fa5]': 匹配 给 定 字符 串 中 所 有 汉字 。 

(21) ^\d{18) |\d{15) $": 检查 给 定 字符 串 是 否 为 合法 身份 证 格式 。 

(22) \d{4)-\d{1,2}-\d{1,2}':; 匹配 指定 格式 的 日 期 ,例如 2016-1-31. 

(23) “Q=. * [az] (=. * [A-Z])(? 一 . x \d)(? 二 .x*[,._J]). {8,}$'; 检查 给 定 字符 
串 是 否 为 强 密码 ,必须 同时 包含 英语 大 写字 母 、 英 文 小 写字 母 .数字 或 特殊 符号 (如 英文 豆 
号 .英文 句号 下划线 ) ,并 且 长 度 必 须 至 少 8 位 。 

(24) "OL x* [AAV 5%. +": 如 果 给 定 字符 串 中 包含 、"、/、;、 二 、%、? 则 匹配 
失败 ,关于 子 模式 语法 请 参考 表 4-4。 

(25)“.)\\1 十 ': 匹配 任意 字符 的 一 次 或 多 次 重复 出 现 。 

在 具体 构造 正则 表达 式 时 ,要 注意 到 可 能 会 发 生 的 错误 ,尤其 是 涉及 特殊 字符 的 时 候 。 
例如 下 面 这 段 代码 (完整 代码 参见 4. 2. 6 节 的 例 4-4) ,作用 是 用 来 匹配 Python 程序 中 的 运 
算 符 ,但 是 因为 有 些 运 算 符 与 正则 表达 式 的 元 字符 相同 而 引起 歧义 ,如 果 处 理 不 当 则 会 造成 
理解 错误 ,需要 进行 必要 的 转 义 处 理 。 

>>> import re 

>>> symbols=([",', "+", "=", "#0, '/', '//'", >> '<<', t= f=", 

tetr] 

>>> for i in symbols: 

patter=re.compile(r'\s* '+i+r'\s* ') 
error: multiple repeat 

>>> for i in symbols: 


patter=re.compile(r'\s* 't+re.escape(i)+r'\s* ') 


正常 执行 
4.2.2 re 模块 主要 方法 


在 Python 中 , 主要 使 用 re 模块 来 实现 正则 表达 式 的 操作 。 该 模块 的 常用 方法 如 
K 4-3 所 示 , 具 体 使 用 时 , 既 可 以 直接 使 用 re 模块 的 方法 进行 字符 串 处 理 ,也 可 以 将 模式 编 
译 为 正则 表达 式 对 象 ,然后 使 用 正则 表达 式 对 象 的 方法 来 操作 字符 串 。 
表 4-3 re 模块 常用 方法 


方 ”法 功能 说 明 
compile(pattern[ ,flags]) 创建 模式 对 象 
search(pattern, string[ ,flags]) 在 整个 字符 串 中 寻找 模式 ,返回 match 对 象 或 None 
match(pattern, string[ ,flags]) 从 字符 串 的 开始 处 匹配 模式 ,返回 match 对 象 或 None 
findall(pattern, string[ ,flags]) 列 出 字符 串 中 模式 的 所 有 匹配 项 
split(pattern, string[ ,maxsplit 一 0]) 根据 模式 匹配 项 分 割 字符 串 
sub(pat, repl, string .count=0]) 将 字符 串 中 所 有 pat 的 匹配 项 用 repl 替换 
escape(string) 将 字符 串 中 所 有 特殊 正则 表达 式 字符 转 义 
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其 中 ,函数 参数 flags 的 值 可 以 是 re. I( 忽 略 大 小 写 ) 、re. Lyre. M( 多 行 匹 配 模 式 ) ,re.S 
(使 元 字符 “. "匹配 任意 字符 ,包括 换行 符 ) re. U( 匹 配 Unicode 字符 ) .re.X( 忽 略 模式 中 的 
空格 ,并 可 以 使 用 # 注 释 ) 的 不 同 组 合 (使 用 |? 进行 组 合 ) 。 


4.2.3 直接 使 用 re 模块 方法 
可 以 直接 使 用 re 模块 的 方法 来 实现 正则 表达 式 操作 。 


>>> import re 

>>> text= 'alpha. beta....gamma delta’ 

>>> re.split ('[\. ]+', text) 

['alpha', 'beta', 'gamma', 'delta'] 

>>> re.split ('[\. ]+', text, maxsplit=2) # 分 割 2 次 
['alpha', 'beta', 'gamma delta'] 

>>> pat= ' [a- zA- 2]+" 

>>> re.findall (pat, text) # 查 找 所 有 单词 
['alpha', 'beta', 'gamma', 'delta'] 

>>> pat= ' {name} ' 

>>> text= 'Dear {name} ...' 

>>> re.sub (pat, 'Mr.Dong', text) # 字 符 串 替换 
"Dear Mr.Dong..." 

>>> s='asd' 


>>> re.sub('als|d', 'good', s) # 字 符 串 替换 
"good good good' 

>>> re.escape ("http://www.python.org') # 字 符 串 转 义 
‘http\\ :\\/\ /www\\ .python\\ .org" 

>>> print (re.match('done|quit', 'done')) # 匹 配 成 功 
<_sre.SRE Match object at 0x00B121A8> 

>>> print (re.match('done|quit', 'done!")) # 匹 配 成 功 
<_sre.SRE Match object at 0x00B121A8> 

>>> print (re.match('done|quit', 'doe!')) # 匹 配 不 成 功 
None 


>>> print (re.search ('done|quit', 'd!one!done") ) # 匹 配 成 功 
<_sre.SRE Match object at 0x0000000002D03D98> 


下 面 的 代码 使 用 不 同 的 方法 删除 字符 串 中 多 余 的 空格 ,连续 多 个 空格 只 保留 一 个 。 


>>> import re 

>>> s= 'aaa bb cde fff z 

>>> re.sub('\s+', ' ', s) # 直 接 使 用 re 模块 的 字符 串 替 换 方法 
"aaabbcdefff " 

>>> re.split("[\s]+', s) 

[tagat Tb "et, "d",. Mes "FEE "| 

>>> re.split('{\s]+', s.strip()) # 同 时 删除 了 字符 串 尾部 的 空格 
['aaa', "bb', 'c', 'd', 'e', EEF") 

>>> ' '.join(re.split('[\s]+', s.strip())) 

"aaa bb cde fff" 
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>>> ' '.join(re.split("\s+", s.strip())) 

"aaa bb cde fff" 

>>> re.sub("\st+', ' ', s.strip()) 

‘aaa bb cde fff" 

>>> s.split () # 也 可 以 不 使 用 正则 表达 式 
['aaa', 'bb', 'c', 'd', 'e', 'fff'] 

>>> ' '.join(s.split ()) 

‘aaa bb cde fff" 


下 面 的 代码 使 用 以 “\” 开 头 的 元 字符 来 实现 字符 串 的 特定 搜索 。 


>>> import re 
>>> example= 'ShanDong Institute of Business and Technology is a very beautiful school.' 


>>> re.findall ("\\ba.+ ?\\b', example) # 以 a 开头 的 完整 单词 
‘and', 'a'] 

>>> re.findall ("\\ba\w* \\b', example) 
‘and', 'a'] 


>>> re.findall ('\\Bo.+ A\b', example) 。。 # 含 有 字母 的 单词 中 第 一 个 非 首 字母 。 的 剩余 部 分 
"ong', 'ology', 'ool'] 

>>> re.findall ('\\b\w.+ 2\\b', example) # 所 有 单词 

'ShanDong', 'Institute', 'of', 'Business', 'and', 'Technology', 'is', 'a', 

"very', 'beautiful', 'school"] 

>>> re.findall (r'\b\w.+ 2\b', example) HERH FITR ,减少 需要 输入 的 符号 数量 
'ShanDong', 'Institute', 'of', 'Business', 'and', 'Technology', 'is', 'a', 

"very', 'beautiful', 'school'] 

>>> re.split('\s', example) # 使 用 任何 空白 字符 分 割 字符 串 

"ShanDong', 'Institute', 'of', 'Business', 'and', 'Technology', 'is', 'a', 

"very', 'beautiful', 'school.'] 

>>> re.findall ("\d\.\d\.\d+ ', "Python 2.7.11") # 查 找 并 返回 x.x.x 形 式 的 数字 
"2.7.11"] 

>>> re.findall ("\d\.\d\.\d+ ', "Python 2.7.11, Python 3.5.1") 

"2.7.11", '3.5.1°] 


4.2.4 使 用 正则 表达 式 对 象 


首先 使 用 re 模块 的 compile( ) 方 法 将 正则 表达 式 编译 生成 正则 表达 式 对 象 ,然后 再 使 


用 正则 表达 式 对 象 提供 的 方法 进行 字符 串 处 理 , 使 用 编译 后 的 正则 表达 式 对 象 可 以 提高 字 


正则 表达 式 对 象 的 match(string[ ,pos[ ,endpos]]) 方 法 在 字符 串 开 头 或 指定 位 置 进行 


搜索 ,模式 必须 出 现在 字符 串 开 头 或 指定 位 置 ;search(string[ ,pos [,endpos]]) 方 法 在 整个 
字符 串 或 指定 范围 中 进行 搜索 ;findall(string[ ,pos [.endpos]]) 方 法 在 字符 串 中 查找 所 有 


全 
二 日 
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正则 表达 式 的 字符 串 并 以 列表 形式 返回 。 


>>> import re 

>>> example= 'ShanDong Institute of Business and Technology’ 
>>> pattern=re.compile (r'\bB\wt\b") # 以 B 开 头 的 单词 
>>> pattern. findall (example) 


['Business'] 
>>> pattern=re.compile (r'\w+ g\b') # 以 g 结 尾 的 单词 

>>> pattern.findall (example) 

['ShanDong'] 

>>> pattern= re.corpile (r'\b[a- zA- 2] {3\b)  #ER 3 个 字母 长 的 单词 
>>> pattern.findall (example) 


['and'] 
>>> pattern.match (example) # 从 字符 串 开 头 开始 匹配 ,不 成 功 , 没 有 返回 值 
>>> pattern.search (example) # 在 整个 字符 串 中 搜索 ,成 功 


<_sre.SRE Match object at 0x01228EC8> 
>>> pattern=re.compile(r'\b\w* a\w* \b') ##ikMAARASE ah Hid 
>>> pattern. findall (example) 

['ShanDong', 'and'] 

>>> text="He was carefully disguised but captured quickly by police." 
>>> re.findall (x"\wt ly", text) # 查 找 所 有 副词 
['carefully', 'quickly'] 


正则 表达 式 对 象 的 sub(repl,string[ .count=0]) Ml subn(repl,string[ ,count 二 0]) 方 法 
用 来 实现 字符 串 替 换 功 能 。 


>>> example='''Beautiful is better than ugly. 

Explicit is better than implicit. 

Simple is better than complex. 

Complex is better than complicated. 

Flat is better than nested. 

Sparse is better than dense. 

Readability counts.''' 

>>> pattern=re.compile (r'\bb\w* \b', re.I) 

>>> pattern.sub('* ', example) # 将 以 字母 Al B 开 头 的 单词 替换 为 * 
* is * than ugly. 

Explicit is * than implicit. 

Simple is * than complex. 

Complex is * than complicated. 

Flat is * than nested. 

Sparse is * than dense. 

Readability counts. 

>>> pattern.sub('* ', example, 1) # 只 替换 一 次 
* is better than ugly. 

Explicit is better than implicit. 

Simple is better than complex. 

Complex is better than complicated. 

Flat is better than nested. 

Sparse is better than dense. 

Readability counts. 

>>> pattern=re.compile (r'\bb\w* \b') 

>>> pattern.sub('* ', example, 1) # 将 第 一 个 以 字母 b 开 头 的 单词 替换 为 * 
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Beautiful is * than ugly. 
Explicit is better than implicit. 
Simple is better than complex. 
Complex is better than complicated. 
Flat is better than nested. 

Sparse is better than dense. 
Readability counts. 


正则 表达 式 对 象 的 split(string[ ,maxsplit 二 0]) 方 法 用 来 实现 字符 串 分 割 。 


>>> example=r'one, two, three. four/five\six? seven [eight]nine|ten' 
>>> pattern=re.compile(r'[,-A\?{\]\1]") # 指 定 多 个 可 能 的 分 隔 符 
>>> pattern.split (example) 


['one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight', 'nine', 'ten'] 


>>> example= r'oneltwo2three3four4fiveSsix6seven7eight8nineSten'" 

>>> pattern=re.compile(r'\d+ ') # 使 用 数字 作为 分 隔 符 

>>> pattern.split (example) 

['one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight', 'nine', 'ten'] 
>>> example=r'one two three four, five.six.seven,eight,nine9ten' 

>>> pattern=re.compile(r' [\s, .\d]+ ') # 人 允许 分 隔 符 重复 

>>> pattern.split (example) 


['one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight', 'nine', 'ten'] 


4.2.5 子 模 式 与 match 对 象 


使 用 圆 括号 ”() ”表示 一 个 子 模 式 , 圆 括号 内 的 内 容 作为 一 个 整体 出 现 ,例如 *(red) 十 ”可 
以 匹配 redred redredred 等 多 个 重复 red 的 情况 。 


>>> telNumber= '''Suppose my Phone No. is 0535- 1234567, 

yours is 010- 12345678, his is 025- 87654321.''' 

>>> pattern=re.compile(r' (\d{3, 4})- (\d{7, 8})") 

>>> pattern. findal1 (telNumber) 

[("0535', '1234567'), ("010", '12345678'), ("025", '87654321')] 


正则 表达 式 模块 或 正则 表达 式 对 象 的 match() 方 法 和 search() 方 法 匹配 成 功 后 都 会 返 
El match 对 象 。match 对 象 的 主要 方法 有 group()( 返 回 匹 配 的 一 个 或 多 个 子 模式 内 容 )、 
groups()( 返 回 一 个 包含 匹配 的 所 有 子 模式 内 容 的 元 组 )、groupdict() (返回 包含 匹配 的 所 有 
命名 子 模式 内 容 的 字典 ) \start()( 返 回 指定 子 模式 内 容 的 起 始 位 置 ) .end()( 返 回 指定 子 模 
式 内 容 的 结束 位 置 的 前 一 个 位 置 ) ,span()( 返 回 一 个 包含 指定 子 模式 内 容 起 始 位 置 和 结束 
位 置 前 一 个 位 置 的 元 组 ) 等 。 例 如 ,下 面 的 代码 使 用 re 模块 的 search() 方 法 返回 的 match 
对 象 来 删除 字符 串 中 指定 内 容 。 


>>> email= "tony@ tiremove thisger.net" 
>>> m= re.search ("remove this", email) 
>>> email[:m.start ()]+email [m.end() :] 


"tony@ tiger.net' 
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下 面 的 代码 演示 了 match 对 象 的 group() 方 法 的 用 法 。 


>>> m=re.match(r"(\wt) (\wt)", "Isaac Newton, physicist") 


>>> m.group (0) # 返 回 整个 模式 内 容 
"Isaac Newton' 

>>> m.group (1) # 返 回 第 1 个 子 模式 内 容 
‘Isaac’ 

>>> m.group (2) # 返 回 第 2 子 模式 内 容 
"Newton' 


>>> m.group(1, 2) # 返 回 指定 的 多 个 子 模 式 内 容 

("Isaac', 'Newton') 

>>> m= re.match (r" (?P< first_name>\wt) (?P<last_name>\wt)", "Malcolm Reynolds") 
>>> m.group('first_name') 

"Malcolm" 

>>> m.group('last_name') 

"Reynolds" 


下 面 的 代码 演示 了 match 对 象 的 groups() 方 法 的 用 法 。 


>>> m=re.match (r" (\dt)\. (\d+)", 24.1632") 
>>> m.groups () 
('24', '1632') 


下 面 的 代码 演示 了 match 对 象 的 groupdict() 方 法 。 


>>> m= re.match (r" (?P< first_name>\wt) (?P<last_name>\w+)", "Malcolm Reynolds") 
>>> m.groupdict () 
{'first_name': 'Malcolm', 'last_name': 'Reynolds'} 


下 面 的 代码 使 用 正则 表达 式 提取 字符 串 中 的 电话 号 码 。 
import re 


telNumber= ' ' ' Suppose my Phone No. is 0535- 1234567, yours is 010- 12345678, his is 025- 
87654321. ''' 
pattern= re.compile (r' (\d{3, 4})- (\d{7, 8})") 
index=0 
while True: 
matchResult = pattern.search (telNumber, index) 
if not matchResult: 
break 
print ('- ' * 30) 
print ('Success:') 
for i in range (3): 
print ("Searched content:', matchResult.group(i),\ 
' Start from:', matchResult.start (i), 'End at:', matchResult.end(i),\ 
' Its span is:', matchResult.span (i) ) 
index=matchResult .end (2) 


上 面 程序 的 运行 结果 (部 分 ) 为 : 


m 
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Success: 


Searched content: 0535- 1234567 Start from: 24 End at: 36 Its span is: (24, 36) 


Searched content: 0535 


Start from: 24 End at: 28 Its span is: (24, 28) 


Searched content: 1234567 Start from: 29 End at: 36 Its span is: (29, 36) 


使 用 子 模式 扩展 语法 可 以 实现 更 加 复杂 的 字符 串 处 理 , 常 用 扩展 语法 如 表 4-4 所 示 。 


R44 子 模式 扩展 语法 


语 法 功能 说 明 
(?P<groupname>) 为 子 模式 命名 
(2?iLmsux) 设置 匹配 标志 ,可 以 是 几 个 字母 的 组 合 , 每 个 字母 含义 与 编译 标志 相同 
sd 匹配 但 不 捕获 该 匹配 的 子 表达 式 


(?P=groupname) 


表示 在 此 之 前 的 命名 为 groupname 的 子 模式 


(#0) 表示 注释 

Esa 用 于 正则 表达 式 之 后 ,表示 如 果 == 后 的 内 容 在 字符 串 中 出 现 则 匹配 ,但 不 
a 返回 一 之 后 的 内 容 

ned 用 于 正则 表达 式 之 后 ,表示 如 果 ! 后 的 内 容 在 字符 串 中 不 出 现 则 匹配 ,但 
a 不 返回 ! 之 后 的 内 容 

(?<=...) 用 于 正则 表达 式 之 前 ,与 (? 一 …) 含 义 相同 

(Ta 用 于 正则 表达 式 之 前 ,与 (?!.…) 含 义 相同 


下 面 通 过 几 个 示例 来 演示 子 模式 扩展 语法 的 应 用 。 


>>> import re 


>>> exampleString= '''There should be one-- and preferably only one -- obvious way to do it. 


Although that way may not be obvious at first unless you're Dutch. 


Now is better than never. 

Although never is often better than right now.''' 

>>> pattern= re.compile (r' (2<=\w\s)never (2=\s\w)') # 查 找 不 在 句子 开头 和 结尾 的 单词 
>>> matchResult=pattern.search (exampleString) 


>>> matchResult.span () 
(172, 177) 


>>> pattern=re.compile (r' (?<=\w\s) never') 


# 查 找 位 于 句子 末尾 的 单词 


>>> matchResult=pattern.search (exampleString) 


>>> matchResult.span () 
(156, 161) 


>>> pattern=re.compile(r' (?:is\s)better (\sthan) ') 


>>> matchResult= pattern.search (exampleString) 


>>> matchResult . span () 
(141, 155) 


>>> matchResult .group (0) 


"is better than' 
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# 组 0 表示 整个 模式 


# 查 找 前 面 是 is 的 better than 组 合 


BER 


>>> matchResult .group (1) 
* than 
>>> pattern=re.compile(r'\b(?i)n\wt\b") # 查 找 以 n 或 N 字 母 开头 的 所 有 单词 
>>> index=0 
>>> while True: 

matchResult=pattern.search (exampleString, index) 

if not matchResult: 

break 

print (matchResult.group(0), ':', matchResult.span (0) ) 

index= matchResult.end (0) 
not : (92, 95) 
Now : (137, 140) 
never : (156, 161) 
never : (172, 177) 
now : (205, 208) 
>>> pattern=re.compile(r' (?< !not\s)be\b') # 查 找 前 面 没 有 单词 not 的 单词 be 
>>> index=0 
>>> while True: 

matchResult= pattern.search (exampleString, index) 

if not matchResult: 

break 

print (matchResult.group(0), ':', matchResult.span (0) ) 

index= matchResult.end(0) 
be : (13, 15) 
>>> exampleString[13:20] # 验 证 一 下 结果 是 否 正 确 
"be one- ' 
>>> pattern=re.compile (r' (\b\w* (?P< £>\w+) (?P=f)Nwx \b) ') 

# 查 找 具 有 连续 相同 字母 的 单词 

>>> index=0 
>>> while True: 

matchResult= pattern.search (exampleString, index) 

if not matchResult: 


break 


print (matchResult.group (0), ' 
index= matchResult.end(0)+1 


', matchResult .group (2) ) 


unless: s 
better :七 
better : t 
>>> s 


'aabc abcd abbed abccd abcdd' 

>>> p= re.compile (r' (\b\w* (?P< f>\w+ ) (2P=f)\w* \b) ') 

>>> p.findall (s) 

[('aabc', 'a'), ("abbcd', 'b'), ('abccd', 'c'), ("abcdd', 'd')] 
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4.2.6 正则 表达 式 应 用 案例 精 选 


例 4-3 编写 程序 ,提取 Python 程序 中 的 类 名 、 函 数 名 以 及 变量 名 等 标识 符 。 
将 下 面 的 代码 保存 为 FindIdentifiersFromPyFile. py, 在 命令 提示 符 环 境 中 使 用 命令 


“Python FindIdentifiersFromPyFile. py 目标 文件 名 ”查找 并 输出 目标 文件 中 的 标识 符 。 
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import re 
import os 
import sys 


classes= {} 

functions= [] 

variables= {"normal':{}, 'parameter':{}, 'infor':{}} 

'''This is a test string: 

atest, btest=3, 5 

to verify that variables in comments will be ignored by this algorithm 


def _identifyClassNames (index, line): 
'''parameter index is the line number of line, 
parameter line is a line of code of the file to check''' 
pattern=re.compile(r' (?<=class\s) \wt (?=.* ?:)$') 
matchResult=pattern.search (line) 
if not matchResult: 
return 
className= matchResult .group (0) 
classes [className] = classes.get (className, []) 


classes [className] .append (index) 


def _identifyFunctionNames (index, line): 
pattern= re.compile(r' (2<=def\s) (\wt)\((.*?)\) (2=:)$ ') 
matchResult=pattern.search (line) 
if not matchResult: 
return 
functionName= matchResult.group (1) 
functions.append ((functionName, index) ) 
parameters=matchResult.group (2) -split (r', ') 
if parameters([0] =='': 
return 
for v in parameters: 
variables |['parameter"] [v]=variables['parameter'].get (v, []) 
variables ['parameter'] [v] -append (index) 


def _identifyVariableNames (index, line): 
# find normal variables, including the case: a, b=3, 5 


pattern= re.compile(r'\b(.*?) (2=\s=)$") 
matchResult= pattern. search (line) 
if matchResult: 
vs=matchResult .group(1) .split (r', ') 
for v in vs: 
# consider the case 'if variable ==value' 
if ‘if 'inv: 
v=v.split () [1] 
# consider the case: 'a[3]=3' 
i£ 7 [° ins 
v=v[0:v.index('[')] 
variables ['normal'] [v] = variables ['normal'] .get (v, []) 
variables ['normal'] [v] .append (index) 
# find the variables in for statements 
pattern=re.compile(r' (?<=for\s) (.*?) (?=\sin)$ ') 
matchResult = pattern.search (line) 
if matchResult: 
vs=matchResult.group(1).split(r', ') 
for v in vs: 
variables ['infor'] [v]=variables['infor'].get(v, []) 


variables ['infor'] [v] «append (index) 


def output () : 
print ('=' * 30) 
print ('The class names and their line numbers are:') 
for key, value in classes.items(): 
print (key, ':', value) 
print ('='* 30) 
print ('The function names and their line numbers are:') 
for i in functions: 
print (i[0], ':', if1]) 
print ('=' * 30) 
print ('The normal variable names and their line numbers are:') 
for key, value in variables ['normal"].items(): 
print (key, ':', value) 
print ('-"* 20) 
print ('The parameter names and their line numbers in functions are:') 
for key, value in variables ['parameter'].items(): 
print (key, ':', value) 
print ('-'* 20) 
print ("The variable names and their line numbers in for statements are:') 
for key, value in variables['infor'].items(): 


print (key, ':', value) 


# suppose the lines of comments less than 50 
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def comments (index) : 
for i in range (50): 
line=allLines [index +i].strip() 
if line.endswith('"""') or line.endswith ("'''"): 


return i+1 


if __name_=='_main ': 
fileName=sys.argv[1] 
if not os.path.isfile (fileName) : 
print ("Your input is not a file.') 
sys.exit (0) 
if not fileName.endswith('.py'): 
print ("Sorry. I can only check Python source file.') 
sys.exit (0) 
allLines= [] 
with open (fileName, 'r') as fp: 
allLines= fp.readlines () 
index= 0 
totalLen= len (allLines) 
while index <totalLen: 
line=allLines [index] 
# strip the blank characters at both end of line 
line= line.strip() 
# ignore the comments starting with '#' 


if line.startswith('#'): 


index +=1 
continue 
# ignore the comments between ''' or """ 
if line.startswith('"""') or line.startswith("'''"): 


index +=comments (index) 

continue 
# identify identifiers 
_identifyClassNames (index+1, line) 
_ identi fyFunctionNames (index+1, line) 
_ identi fyVariableNames (index+1, line) 
index +=1 

output () 


例 4-4 编写 程序 ,并 用 该 程序 检查 另 一 个 Python 程序 的 代码 风格 是 否 符合 规范 。 
本 例 代 码 主要 检查 Python 程序 的 一 些 基 本 规范 ,例如 运算 符 两 侧 是 否 有 空格 ,是 否 每 
次 只 导入 一 个 模块 ,在 不 同 的 功能 模块 之 间 是 否 有 空 行 ,等 等 。 


import sys 
import re 


def checkFormats (lines, desFileName) : 
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fp=open (desFileName, 'w') 
for i, line in enumerate (lines) : 
print ('=' * 30) 
print ("Line:', it 1) 
if line.strip() .startswith ('# '): 
print (' '* 10+ 'Comments.Pass.') 
fp.write (line) 


continue 
flag=True 
# check operator symbols 
SYMONS Ey ee Ny, PS OR Se EO BS Sy MS Sy, Sy 
| 


temp_line=line 
for symbol in symbols: 
pattern= re.compile(r'\s *'+ re.escape (symbol)+r'\s *') 
temp_line=pattern.split (temp line) 
sep=' '+ symbol+' ' 
temp line= sep.join(temp_line) 
if line != temp line: 
flag= False 
print(' '* 10+ 'You may miss some blank spaces in this line. ') 
# check import statement 
if line.strip() .startswith ('import') : 
if ',' in line: 
flag= False 
print(' '* 10+ "You'd better import one module at a time.") 
temp line= line.strip() 
modules= temp line[temp line.index(' ')+1:] 
modules= modules.strip() 
pattern= re.compile(r'\s* ,\s*') 
modules= pattern.split (modules) 
temp_line='' 
for module in modules: 
temp line +=line[:line.index("import')]+ "import '+module+ '\n' 
line=temp_line 
pri_line= lines [i-1].strip() 
if pri_line and (not pri_line.startswith('import')) and \ 
(not pri_line.startswith('#')): 
flag= False 
print (' '* 10+ "You should add a blank line before this line.') 
line='\n"+ line 
after _line= lines[i+1].strip() 
if after line and (not after_line.startswith('import')): 
flag= False 
print(' '* 10+ "You should add a blank line after this line. ') 
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line =linet+'\n' 
# check if there is a blank line before new funtional code block 
# including the class/function definition 
if line.strip() and not line.startswith(' ') and i >0: 
pri line= lines[i-1] 
if pri_line.strip() and pri_line.startswith(' '): 
flag= False 
print(' '* 10+ "You'd better add a blank line before this line.") 
line= '\n'+ line 
if flag: 
print(' '* 10 + 'Pass.') 
fp.write (line) 
fp.close() 


fileName= sys.argv[1] 
fileLines= [] 
with open (fileName, 'r') as fp: 
fileLines= fp.readlines () 
desFileName= fileName[:-3]+'_new.py" 
checkFormats (fileLines, desFileName) 
# check the ratio of comment lines to all lines 
comments= [line for line in fileLines if line.strip().startswith('#')] 
ratio= len (comments) /len(fileLines) 
if ratio <=0.3: 
print ("= '* 30) 
print ("Comments in the file is less than 30% .') 


print ("Perhaps you should add some comments at appropriate position.') 


AS 章 小 结 


(1) 在 Python 中 ,字符 串 属于 不 可 变 序列 类 型 ,使 用 单 引 号 、 双 引号 、 三 单 引号 或 三 双 
引号 作为 界定 符 , 并 且 不 同 的 界定 符 之 间 可 以 互相 嵌 套 。 

(2) 字符 串 属于 有 序 不 可 变 序 列 ,不 支持 任何 方法 来 直接 修改 字符 串 的 内 容 。 

(3) 在 格式 化 字符 串 时 ,优先 考虑 使 用 format() 方 法 。 

(4) Python 3. x 全 面 支持 中 文 ,Python 2. x 对 中 文 支持 还 不 够 ,在 处 理 中 文 时 需要 在 
不 同 的 编码 格式 之 间 进 行 必要 的 转换 。 

(5) 对 于 短 字符 串 ,Python 支持 驻 留 机 制 , 即 相同 的 字符 串 在 内 存 中 只 有 一 个 副本 ,长 
字符 串 不 具有 这 个 特性 。 

(6) 虽然 字符 串 属于 不 可 变 序列 ,但 支持 使 用 replace() 方 法 .maketrans() 和 translate 
(0) 方 法 以 及 正则 表达 式 的 方法 进行 内 容 蔡 换 操作 ,这些 方法 都 返回 新 字符 串 ,并 不 对 原 字 符 
串 做 任何 修改 。 
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(7) 字符 串 的 splitO Al rsplit() 方 法 分 别 用 来 以 指定 字符 为 分 隔 符 , 从 字符 串 左 端 和 右 
端 开 始 将 其 分 割 成 多 个 字符 串 ,并 返回 包含 分 割 结果 的 列表 ;join() 方 法 用 来 将 列表 中 多 个 
字符 串 进行 连接 ,并 在 相 邻 两 个 字符 串 之 间 插 入 指定 字符 。 

(8) 对 用 户 输入 的 字符 串 进行 eval() 操 作 时 可 能 会 有 安全 漏洞 ,应 对 用 户 输入 的 内 容 
进行 必要 的 检查 和 过 滤 。 

(9) 在 string 模块 中 定义 了 多 个 字符 串 常量 ,包括 数字 字符 、 表 达 符 号 、 英 文字 母 、 大 写 
字母 ,小写 字母 等 。 

(10) 正则 表达 式 是 字符 串 处 理 的 有 力 工 具 和 技术 ,可 以 快速 实现 字符 串 的 复杂 处 理 。 

(11) 可 以 直接 使 用 re 模块 的 方法 来 进行 字符 串 处 理 , 也 可 以 将 模式 编译 为 正则 表达 
式 对 象 ,然后 使 用 正则 表达 式 对 象 的 方法 来 处 理 字符 串 。 

(12) 正则 表达 式 中 的 子 模式 是 作为 一 个 整体 来 对 待 的 ,使 用 子 模式 扩展 语法 可 以 实现 
更 加 复杂 的 字符 串 处 理 要 求 。 

(13) 正则 表达 式 对 象 的 match(string[ ,pos[ ,endpos]]) 方 法 用 于 在 字符 串 开头 或 指定 
位 置 进行 搜索 ,模式 必须 出 现在 字符 串 开 头 或 指定 位 置 ;search(string[ ,pos[L,endpos]]) 方 
法 用 于 在 整个 字符 串 或 指定 范围 中 进行 搜索 ;车 匹配 成 功 ,这 两 个 方法 都 返回 match 对 象 ， 
match 对 象 的 主要 方法 有 group() .groups() ,groupdict() ,start() ,end()、span() 等 。 

(14) 正则 表达 式 对 象 的 findall(string[,pos[,endpos]]) 方 法 用 于 在 字符 串 中 查找 所 
有 符合 正则 表达 式 的 字符 串 并 以 列表 形式 返回 。 


习 题 


1. 假设 有 一 段 英文 ,其 中 有 单独 的 字母 I 误 写 为 i, 请 编写 程序 进行 纠正 。 

2. 假设 有 一 段 英文 ,其 中 有 单词 中 间 的 字母 i 误 写 为 1, 请 编写 程序 进行 纠正 。 

3. 有 一 段 英文 文本 ,其 中 有 单词 连续 重复 了 2 次 ,编写 程序 检查 重复 的 单词 并 只 保留 一 个 。 
例如 ,文本 内 容 为 “This is is a desk.”, 程 序 输出 为 "This is a desk.”。 

4. 简单 解释 Python 的 字符 串 驻 留 机 制 。 

5. 编写 程序 ,用 户 输入 一 段 英文 ,然后 输出 这 段 英文 中 所 有 长 度 为 3 个 字母 的 单词 。 
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第 5 章 函数 设计 与 使 用 


在 实际 开发 中 ,有 很 多 操作 是 完全 相同 或 者 是 非常 相似 的 ,仅仅 是 要 处 理 的 数据 不 
同 而 已 ,因此 经 常会 在 不 同 的 代码 位 置 多 次 执行 相似 或 完全 相同 的 代码 块 。 从 软件 设 
计 和 代码 复 用 的 角度 来 讲 , 很 显然 ,直接 将 该 代码 块 复制 到 多 个 相应 的 位 置 然后 进行 
简单 修改 绝对 不 是 一 个 好 主意 。 虽 然 这 样 使 得 多 份 复制 的 代码 可 以 彼此 独立 地 进行 
修改 ,但 这 样 不 仅 增加 了 代码 量 ,使 得 程序 文件 变 大 ,也 增加 了 代码 理解 和 代码 维护 的 
难度 ,更 重要 的 是 为 代码 测试 和 纠 错 带 来 了 很 大 的 困难 。 一 旦 被 复制 的 代码 块 在 将 来 
某 天 被 发 现存 在 问题 而 需要 修改 , 则 必须 对 所 有 的 复制 都 做 同样 正确 的 修改 ,这 在 实 
际 中 是 很 难 完成 的 一 项 任务 。 由 于 代码 量 的 大 幅度 增加 ,导致 代码 之 间 的 关系 更 加 复 
杂 , 很 可 能 在 修补 旧 漏 洞 的 同时 又 引入 了 新 漏洞 。 因 此 ,应 尽量 减少 使 用 直接 复制 代 
码 块 的 方式 来 实现 复 用 。 

解决 上 述 问 题 的 一 种 常用 方式 是 设计 和 编写 函数 , 另 一 种 是 面向 对 象 程序 设计 中 的 类 ， 
本 董 介 绍 函 数 的 设计 与 使 用 ,第 6 章 介 绍 面向 对 象 程序 设计 。 将 可 能 需要 反复 执行 的 代码 
封装 为 函数 ,并 在 需要 执行 该 段 代 码 功 能 的 地 方 进 行 调用 ,不 仅 可 以 实现 代码 的 复 用 ,更 重 
要 的 是 可 以 保证 代码 的 一 致 性 ,只 需要 修改 该 函数 代码 则 所 有 调用 位 置 均 得 到 体现 。 当 然 ， 
在 实际 开发 中 ,需要 对 函数 进行 良好 的 设计 和 优化 才能 充分 发 挥 其 优势 。 在 编写 函数 时 ,有 
很 多 原则 需要 参考 和 遵守 ,例如 ,不 要 在 同一 个 函数 中 执行 太 多 的 功能 ,尽量 只 让 其 完成 一 
个 高 度 相关 且 大 小 合适 的 功能 ,以 提高 模块 的 内 聚 性 。 另 外 ,尽量 减少 不 同 函 数 之 间 的 隐 式 
耦合 ,例如 减少 全 局 变量 的 使 用 ,使 得 函数 之 间 仅 通过 调用 和 参数 传递 来 显 式 体现 其 相互 
关系 。 

在 编写 函数 时 ,函数 体 中 代码 的 编写 与 前 面 章节 介绍 的 基本 一 致 ,只 是 对 代码 进行 了 封 
装 并 增加 了 函数 调用 、 传 递 参 数 、 返 回 计 算 结果 等 外 围 接口 , 这 也 正 是 本 童 讲解 的 重点 。 另 
外 ,由 于 Python 程序 是 解释 执行 的 ,因此 如 果 函 数 或 代码 编写 的 有 问题 ,只 有 在 被 调用 和 
执行 时 才 可 能 被 发 现 ,甚至 包括 某 些 语法 错误 。 另 外 .还 有 可 能 传递 某 些 类 型 的 参数 时 执行 
正确 ,而 传递 男 一 些 类 型 的 参数 时 则 可 能 会 出 现 错误 。 出 现 这 样 的 情况 有 多 种 可 能 的 原因 ， 
例如 ,不 同 的 参数 值 可 能 会 使 得 函数 执行 不 同 的 路 径 , 或 者 不 同 的 参数 类 型 所 支持 的 操作 和 
运算 符 不 同 ,等 等 。 所 以 ,在 进行 代码 测试 时 一 定 要 注意 ,一 次 或 几 次 运行 正常 并 不 表示 代 
人 码 编写 的 没有 问题 ,必须 进行 尽 可 能 完全 的 测试 ,尽量 满足 各 种 覆盖 性 要 求 ,尽量 在 代码 发 
布 之 前 发 现 和 解决 更 多 的 潜在 问题 。 


函数 设计 与 使 用 


5.1 国 数 定义 与 调用 


在 Python 中 ,定义 函数 的 语法 如 下 : 
def 函数 名 ([ 参 数列 表 ]) : 


vege gee 
函数 体 


在 Python 中 使 用 def 关键 字 来 定义 函数 ,然后 是 一 个 空格 和 函数 名 称 , 接 下 来 是 一 对 
圆 括号 ,在 圆 括号 内 是 形式 参数 列表 ,如 果 有 多 个 参数 则 使 用 逗号 分 隔 开 , 圆 括号 之 后 是 一 
个 冒号 和 换行 ,最 后 是 必要 的 注释 和 函数 体 代码 。 定 义 函数 时 需要 注意 : 

(1) 函数 形 参 不 需要 声明 其 类 型 ,也 不 需要 指定 函数 返回 值 类 型 。 

(2) 即使 该 函数 不 需要 接收 任何 参数 ,也 必须 保留 一 对 空 的 圆 括号 。 

G) 括号 后 面 的 冒号 必 不 可 少 。 

(4) 函数 体 相对 于 def 关键 字 必须 保持 一 定 的 空格 缩 进 。 

最 后 ,Python 允许 找 套 定义 函数 ,并 且 所 有 包含 call _O 〇 方法 的 类 的 对 象 均 被 认为 
是 可 调用 的 ,这 部 分 内 容 请 参见 5. 8 节 的 讨论 。 

例如 ,下 面 的 函数 用 来 计算 斐 波 那 契 数 列 中 小 于 参数 n 的 所 有 值 : 


def fib(n): 
a, b=1,1 
while a<n: 
print (a, end=' ') 
a, b=b, atb 
print () 


该 函数 的 调用 方式 为 
fib(1000) 


在 定义 函数 时 ,开头 部 分 的 注释 并 不 是 必需 的 ,但 是 如 果 为 函数 的 定义 加 上 一 段 注释 ， 
可 以 为 用 户 提供 友好 的 提示 和 使 用 帮助 。 例 如 ,把 上 面 生成 斐 波 那 契 数 列 的 函数 定义 修改 
为 下 面 的 形式 ,在 函数 开头 加 上 一 段 注释 。 


>>> def fib(n): 
accept an integer n. 
return the numbers less than n in Fibonacci sequence.'"'' 
a, b=1, 1 
while a<n: 
print (a, end=' ') 
a, b=b, atb 


print () 


如 此 一 来 ,在 调用 该 函数 时 ,输入 左 侧 圆 括 号 之 后 ,立刻 就 会 得 到 该 函数 的 使 用 说 明 , 如 
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图 5-1 所 示 。 


>>> def fib(n): 
***accept an integer n. 
return the numbers less than n in Fibonacci sequence.''' 
a, b = 1，1 
while a < n: 
print (a, end=' ') 
a, b =b, ab 
print () 


>>> fib 
m) 
accept an integer n. 
[return the numbers less than n in Fibonacci sequence. 


图 5-1 使 用 注释 来 为 用 户 提示 函数 使 用 说 明 


5.2 形 参与 实 参 


盟 数 定义 时 圆 括号 内 是 使 用 逗号 分 隔 开 的 形 参 列 表 (parameters) ,一 个 函数 可 以 没有 
形 参 ,但 是 定义 时 一 对 圆 括号 必须 有 ,表示 这 是 一 个 函数 并 且 不 接收 参数 。 函 数 调用 时 向 其 
传递 实 参 (arguments) ,根据 不 同 的 参数 类 型 ,将 实 参 的 值 或 引用 传递 给 形 参 。 

例如 ,在 5.1 节 中 定义 函数 fib() 时 括号 内 的 n 就 是 该 函数 的 形 参 ,而 调用 该 函数 时 括 
号 内 的 1000 则 是 传递 给 该 函数 的 实 参 。 

在 定义 函数 时 ,对 参数 个 数 并 没有 限制 ,如 果 有 多 个 形 参 , 则 需要 使 用 逗号 进行 分 隔 。 
例如 ,下 面 的 函数 用 来 接收 两 个 参数 ,并 输出 其 中 的 最 大 值 。 


def printMax (a, b): 
if a>b: 
pirnt (a, 'is the max') 
else: 


print (b, 'is the max') 


当然 ,这 里 只 是 为 了 演示 ,而 忽略 了 一 些 细 节 , 如 果 输 入 的 参数 不 支持 比较 运算 , 则 会 出 
错 , 可 以 参考 后 面 第 8 章 中 介绍 的 异常 处 理 结构 来 解决 这 个 问题 。 
对 于 绝 大 多 数 情况 下 ,在 函数 内 部 直接 修改 形 参 的 值 不 会 影响 实 参 。 例 如 : 


>>> def addOne (a): 
print (a) 
at=1 
print (a) 

>>> a=3 


>>> addone (a) 


>>> a 
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从 运行 结果 可 以 看 出 ,在 函数 内 部 修改 了 形 参 a 的 值 ,但 是 当 函 数 运行 结束 以 后 , 实 参 
a 的 值 并 没有 被 修改 ,可 以 参考 5. 5 节 中 关于 变量 作用 域 的 讨论 。 当 然 ,在 有 些 情况 下 ,可 
以 通过 特殊 的 方式 在 函数 内 部 修改 实 参 的 值 ,例如 下 面 的 代码 : 


>>> def modify (v) : # 修 改 列表 元 素 值 
v[0]=v[0]+1 

>>> a= [2] 

>>> modify (a) 

>>> a 

[3] 

>>> def modify (v, item): # 为 列表 增加 元 素 
v.append (item) 

>>> a= [2] 

>>> modify(a, 3) 


>>> a 

[2, 3] 

>>> def modi fy (d) : # 修 改 字典 元 素 值 或 为 字典 增加 元 素 
d['age']=38 


>>> a= {'name':'Dong', 'age':37, 'sex':'Male'} 

>>> modify (a) 

>>> a 

{'age': 38, 'name': 'Dong', 'sex': 'Male'} 

也 就 是 说 ,如 果 传递 给 函数 的 是 Python 可 变 序 列 , 并 且 在 函数 内 部 使 用 下 标 或 其 他 方 
式 为 可 变 序 列 增加 、 删 除 元 素 或 修改 元 素 值 时 ,修改 后 的 结果 是 可 以 反映 到 函数 之 外 的 , 即 
实 参 也 得 到 相应 的 修改 。 


5.3 参数 类 型 


在 Python 中 ,函数 参数 有 很 多 种 ,主要 可 以 分 为 普通 参数 、 默 认 值 参 数 .关键 参 数 、 可 
变 长 度 参数 等 。Python 函数 的 定义 也 非常 灵活 ,在 定义 函数 时 不 需要 指定 参数 的 类 型 , 形 
参 的 类 型 完全 由 调用 者 传递 的 实 参 类 型 以 及 Python 解释 器 的 理解 和 推断 来 决定 ;同样 ,也 
不 需要 指定 函数 的 返回 值 类 型 ,这 将 由 函数 中 的 return 语句 来 决定 。 函 数 的 返回 值 类 型 由 
return 语句 返回 值 的 类 型 来 决定 ,如 果 函 数 中 没有 return 语句 或 者 没有 执行 到 return 语句 
而 返回 或 者 执行 了 不 带 任 何 值 的 return 语句 , 则 函数 都 默认 为 返回 空 值 None。 


5.3.1 默认 值 参 数 


在 定义 函数 时 ,Python 支持 默认 值 参数 , 即 在 定义 函数 时 为 形 参 设置 默认 值 。 在 调用 
带 有 默认 值 参数 的 函数 时 ,可 以 不 用 为 设置 了 默认 值 的 形 参 进行 传 值 ,此 时 函数 将 会 直接 使 
用 函数 定义 时 设置 的 默认 值 。 默 认 值 参数 与 5. 3. 3 节 介绍 的 可 变 长 度 参数 可 以 实现 类 似 于 
函数 重 载 的 目的 。 带 有 默认 值 参 数 的 函数 定义 语法 如 下 : 


def 函数 名 (…, 形 参 名 = 默认 值 ) : 
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函数 体 


调用 带 有 默认 值 参数 的 函数 时 ,可 以 不 对 默认 值 参数 进行 赋值 ,也 可 以 通过 显 式 赋 值 来 
替换 其 默认 值 ,具有 较 大 的 灵活 性 。 如 果 需 要 ,可 以 使 用 “函数 名 . func_defaults”( 在 Python 
3. x 中 使 用 “函数 名 . defaults _”) 随时 查看 函数 所 有 默认 值 参数 的 当前 值 ,其 返回 值 为 
一 个 元 组 ,其 中 的 元 素 依 次 表示 每 个 默认 值 参 数 的 当前 值 。 例 如 下 面 的 函数 定义 ， 


>>> def say (message, times=1): 
print ((messaget ' ') * times) 

>>> say. defaults 

(1,) 


调用 该 函数 时 ,如 果 只 为 第 一 个 参数 传递 实 参 , 则 第 二 个 参数 使 用 默认 值 1, 如 果 为 第 二 个 
参数 传递 实 参 , 则 不 再 使 用 默认 值 1, 而 是 使 用 调用 者 显 式 传递 的 值 。 


>>> say("hello') 

hello 

>>> say("hello', 3) 

hello hello hello 

>>> say("hi', 7) 

hi hi hi hi hi hi hi 

需要 注意 的 是 ,在 定义 带 有 默认 值 参 数 的 函数 时 ,默认 值 参 数 必须 出 现在 函数 形 参 列表 
的 最 右 端 , 且 任何 一 个 默认 值 参数 右边 都 不 能 再 出 现 非 默认 值 参数 。 例 如 下 面 的 示例 ,前 两 
个 函数 不 符合 这 一 要 求 , 从 而 导致 函数 定义 失败 ,如 图 5-2 所 示 。 


>>> def £(a=3,b,c=5): 
print a,b,c 
SyntaxError: non-default argument follows default argument 
>>> def £(a=3,b): 
print a,b 
SyntaxError: non-default argument follows default argument 


>>> def £(a,b,c=5): 
print a,b,c 


图 5-2 ” 带 有 默认 值 参数 的 函数 定义 


另外 ,特别 需要 注意 的 是 ,多 次 调用 函数 并 且 不 为 默认 值 参 数 传递 值 时 ,默认 值 参 数 只 
在 第 一 次 调用 时 进行 解释 。 对 于 列表 、 字 典 这 样 复杂 类 型 的 默认 值 参 数 , 这 一 点 可 能 会 导致 
很 严重 的 逻辑 错误 ,而 这 种 错误 或 许 会 耗费 较 多 的 精力 来 定位 和 纠正 。 例 如 


def demo (newitem, old list= []) : 
old list.append (newitem) 
return old_list 

print (demo('5", [1, 2, 3, 4])) 

print (demo ('aaa', ['a', 'b'])) 

print (demo ('a')) 

print (demo ('b')) 
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运行 一 下 上 面 的 代码 ,仔细 看 看 结果 ,是 否 能 发 现 问题 呢 ? 然后 把 代码 修改 为 下 面 的 样 
子 , 再 运行 一 下 ,看 看 区 别 在 哪里 。 仔 细 阅 读本 节 前 面 的 内 容 ,应 该 会 发 现 答案 。 


def demo (newitem, old list=None) : 
if old list is None: 
old list= [] 
old list.append (newitem) 
return old_list 
print (demo('5', [1, 2, 3, 4])) 
print (demo ('aaa', ['a', 'b'])) 
print (demo ('a')) 
print (demo ('b')) 


5.3.2 关键 参数 


关键 参数 主要 指 调用 函数 时 的 参数 传递 方式 ,而 与 函数 定义 无 关 。 通 过 关键 参数 可 以 
按 参数 名 字 传 递 值 , 实 参 顺序 可 以 和 形 参 顺序 不 一 致 , 但 不 影响 参数 值 的 传递 结果 ,避免 了 
用 户 需 要 牢记 参数 位 置 和 顺序 的 麻烦 ,使 得 函数 的 调用 和 参数 传递 更 加 灵活 方便 。 

>>> def demo (a, b, c=5): 

print (a, b, c) 

>>> demo (3, 7) 

375 

>>> demo (c=8, a=9, b=0) 

908 


5.3.3 可 变 长 度 参数 


可 变 长 度 参数 在 定义 函数 时 主要 有 两 种 形式 : *parameter 和 xxparameter, 前 者 用 来 接 
收 任意 多 个 实 参 并 将 其 放 在 一 个 元 组 中 ,后 者 接收 类 似 于 关键 参数 一 样 显 式 赋值 形式 的 多 
个 实 参 并 将 其 放 入 字典 中 。 

下 面 的 代码 演示 了 第 一 种 形式 可 变 长 度 参数 的 用 法 , 即 无 论调 用 该 函数 时 传递 了 多 少 
实 参 ,一 律 将 其 放 入 元 组 中 : 


>>> def demo (*p) : 
print (p) 
>>> demo (1, 2, 3) 
(1, 2, 3) 
>>> demo (1, 2, 3, 4, 5, 6, 7) 
(1, 2, 3, 4, 5, 6, 7) 


下 面 的 代码 则 演示 了 第 二 种 形式 可 变 长 度 参数 的 用 法 , 即 在 调用 该 函数 时 自动 将 接收 
的 参数 转换 为 字典 : 


>>> def demo (**p) : 


for item in p.items () : 
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print (item) 

>>> demo (x=1, y=2, 2=3) 

Cy", 2) 

('x", 1) 

("2", 3) 

下 面 的 代码 演示 了 定义 函数 时 几 种 不 同形 式 的 参数 混合 使 用 的 用 法 。 虽 然 Python 完 
全 支持 这 样 做 ,但 是 除非 真 的 很 必要 ,否则 请 不 要 这 样 用 ,因为 这 会 使 得 代码 非常 混乱 而 严 
重 降 低 可 读 性 ,并 导致 程序 查 错 非常 困难 。 另 外 ,一 般 而 言 ,一 个 函数 如 果 可 以 接收 很 多 参 
数 , 很 可 能 是 函数 设计 得 不 好 ,例如 ,函数 功能 过 多 ,需要 进行 必要 的 拆 分 和 重新 设计 ,以 满 
足 高 内 聚 的 要 求 。 


>>> def func_4(a, b, c=4, *aa, **bb): 


print ((a, b, c)) 

print (aa) 

print (bb) 
>>> func_4(1, 2, 3, 4, 5, 6, 7, 8, 9, xx='1', yy='2', zz=3) 
(1, 2, 3) 
(4, 5, 6, 7, 8, 9) 


{tyy's '2", text: '1', 'zz': 3} 


5.3.4 参数 传递 时 的 序列 解 包 


为 含有 多 个 变量 的 函数 传递 参数 时 ,可 以 使 用 Python 列表 、 元 组 .集合 .字典 以 及 其 他 
可 迭代 对 象 作为 实 参 ,并 在 实 参 名 称 前 加 一 个 星 号 ,Python 解释 器 将 自动 进行 解 包 ,然后 传 
递 给 多 个 单 变量 形 参 。 如 果 使 用 字典 对 象 作为 实 参 , 则 默认 使 用 字典 的 “ 键 ”, 如 果 需 要 将 字 
典 中 “ 键 - 值 对 "作为 参数 则 需要 使 用 items() 方 法 ,如 果 需 要 将 字典 的 “ 值 ”* 作 为 参数 则 需要 
调用 字典 的 values() 方 法 。 最 后 ,请 务必 保证 实 参 中 元 素 个 数 与 形 参 个 数 相等 ,否则 将 出 现 


错误 。 

>>> def demo (a, b, c): >>> dic={1l:'a', 2:'b', 3:'c"} 
print (atbtc) >>> demo ( * dic) 

>>> seg= [1, 2, 3] 6 

>>> demo ( * seq) >>> Set= {1, 2, 3} 

6 >>> demo ( * Set) 

>>> tup= (1, 2, 3) 6 

>>> demo (* tup) >>> demo ( * dic.values()) 

6 abc 


5.4 return 语句 


return 语句 用 来 从 一 个 函数 中 返回 并 结束 函数 的 执行 ,同时 还 可 以 通过 return 语句 从 
函数 中 返回 一 个 任意 类 型 的 值 。 不 论 return 语句 出 现在 函数 的 什么 位 置 ,一 旦 得 到 执行 将 
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直接 结束 函数 的 执行 。 如 果 函 数 没有 return 语句 或 者 执行 了 不 返回 任何 值 的 return 语句 ， 
Python 将 认为 该 函数 以 return None 结束 , 即 返回 空 值 。 


def maximum( x, y ) : 
if æy: 
return x 
else: 


return y 


作为 使 用 者 ,在 调用 函数 时 ,一 定 要 注意 函数 有 没有 返回 值 ,以 及 是 否 会 对 参数 的 值 进 
行 修改 。 例 如 第 2 章 介绍 过 的 列表 对 象 方法 sort() 属 于 原 地 操作 ,没有 返回 值 , 而 内 置 函 数 
sorted() 则 返回 排序 后 的 列表 ,并 不 对 原 列 表 做 任何 修改 。 


>>> a_list=[1, 2, 3, 4, 9, 5, 7] 
>>> print (sorted (a_list)) 

[1, 2, 3, 4, 5, 7, 9] 

>>> print (a_list) 

[1, 2, 3, 4, 9, 5, 7] 

>>> print (a_list.sort ()) 

None 

>>> print (a_list) 

[1, 2, 3, 4, 5, 7, 9] 


5.5 变量 作用 域 


变量 起 作用 的 代码 范围 称 为 变量 的 作用 域 , 不 同 作用 域内 同名 变量 之 间 互 不 影响 。 一 
个 变量 在 函数 外 部 定义 和 在 函数 内 部 定义 ,其 作用 域 是 不 同 的 ,函数 内 部 定义 的 变量 一 般 为 
局 部 变量 ,而 不 属于 任何 函数 的 变量 一 般 为 全 局 变量 。 一 般 而 言 ,局 部 变量 的 引用 比 全 局 变 
量 速度 快 , 应 优先 考虑 使 用 ,前 面 章节 介绍 过 类 似 问 题 ,此 处 不 再 歼 述 。 另 外 ,除非 真 的 有 必 
要 ,和 否则 应 尽量 避免 使 用 全 局 变量 ,因为 全 局 变量 会 增加 不 同 函 数 之 间 的 隐 式 耦合 度 , 从 而 
降低 代码 可 读 性 ,并 使 得 代码 测试 和 纠 错 变 得 很 困难 。 

在 函数 内 定义 的 普通 变量 只 在 该 函数 内 起 作用 , 称 为 局 部 变量 。 当 函数 运行 结束 后 ,在 
该 函数 内 部 定义 的 局 部 变量 被 自动 删除 而 不 可 访问 。 在 函数 内 部 定义 的 全 局 变量 当 函 数 结 
东 以 后 仍然 存在 并 且 可 以 访问 。 

如 果 想 要 在 函数 内 部 修改 一 个 定义 在 函数 外 的 变量 值 , 那 么 这 个 变量 就 不 能 是 局 部 的 ， 
其 作用 域 必须 为 全 局 的 ,能 够 同时 作用 于 函数 内 外 , 称 为 全 局 变量 ,可 以 通过 global 来 声明 
或 定义 。 这 分 两 种 情况 。 

(1) 一 个 变量 已 在 函数 外 定义 ,如 果 在 函数 内 需要 修改 这 个 变量 的 值 ,并 将 这 个 赋值 结 
果 反 映 到 函数 之 外 ,可 以 在 函数 内 用 global 声明 这 个 变量 为 全 局 变量 ,明确 声明 要 使 用 已 
定义 的 同名 全 局 变量 。 

(2) 在 函数 内 部 直接 使 用 global 关键 字 将 一 个 变量 声明 为 全 局 变量 ,即使 在 函数 外 没 
有 定义 该 全 局 变量 ,在 调用 这 个 函数 之 后 ,将 自动 增加 新 的 全 局 变量 。 


127 


《Python 程序 设计 (第 2 版 )》 


或 者 说 ,也 可 以 这 么 理解 : 在 函数 内 如 果 只 引用 某 个 变量 的 值 而 没有 为 其 赋 新 值 ,该 变 


量 为 ( 隐 式 的 ) 全 局 变量 ;如 果 在 函数 内 任意 位 置 有 为 变量 赋 新 值 的 操作 ,该 变量 即 被 认为 是 
( 隐 式 的 ) 局 部 变量 ,除非 在 函数 内 显 式 地 用 关键 字 global 进行 声明 。 


通过 下 面 的 示例 代码 来 演示 局 部 变量 和 全 局 变量 的 用 法 。 


>>> def demo () : 


global x # 声 明 或 创建 全 局 变量 

x=3 # 修 改 全 局 变量 的 值 

y=4 # 局 部 变量 

print (x, y) 
>>> x=5 # 在 函数 外 部 定义 了 全 局 变量 x 
>>> demo () # 本 次 调用 修改 了 全 局 变量 x 的 值 
3 4 
>>> x 
3 
>>> y # 局 部 变量 在 函数 运行 结束 之 后 自动 删除 
NameError: name 'y' is not defined 
>>> del x # 删 除了 全 局 变量 x 
>>> x 


NameError: name 'x' is not defined 


>>> demo () # 本 次 调用 创建 了 全 局 变量 

3 4 

>>> x 

3 

>>> y # 局 部 变量 在 函数 调用 和 执行 结束 后 自动 删除 ,在 函数 外 部 不 可 访问 


NameError: name 'y' is not defined 


如 果 局 部 变量 与 全 局 变量 具有 相同 的 名 字 ,那么 该 局 部 变量 会 在 自己 的 作用 域内 隐藏 


同名 的 全 局 变量 ,例如 下 面 的 代码 所 演示 。 


>>> def demo () : 
x=3 # 创 建 了 局 部 变量 ,并 自动 隐藏 了 同名 的 全 局 变量 
>>> x= 5 
>>> demo () 
>>> x 
5 


最 后 ,如 果 需 要 在 同一 个 程序 的 不 同 模块 之 间 共 享 全 局 变量 ,可 以 编写 一 个 专门 的 模块 


来 实现 这 一 目的 。 例 如 ,假设 在 模块 A. py 中 有 如 下 变量 定义 : 


global variable=0 


而 在 模块 B. py 中 包含 以 下 语句 : 


import A 
A.global_variable=1 


在 模块 C. py 中 有 以 下 语句 : 
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import A 
print (A.global_variable) 


从 而 实现 了 在 不 同 模块 之 间 共享 全 局 变量 的 目的 。 
5.6 lambda 表达 式 


lambda 表达 式 可 以 用 来 声明 匿名 函数 , 即 没 有 函数 名 字 的 临时 使 用 的 小 函数 。lambda 
表达 式 只 可 以 包含 一 个 表达 式 ,不 允许 包含 其 他 复杂 的 语句 ,但 在 表达 式 中 可 以 调用 其 他 函 
数 ,并 支持 默认 值 参 数 和 关键 参数 ,该 表达 式 的 计算 结果 就 是 函数 的 返回 值 。 下 面 的 代码 演 
示 了 不 同情 况 下 lambda 表达 式 的 应 用 。 


>>> f=lambda x, y, 2: X+Y+Z 
>>> print (f (1, 2, 3)) 
6 
>>> g= lambda x, y=2, 2=3: xtyt+z # 含 有 默认 值 参 数 
>>> print (g(1)) 
6 
>>> print (g(2, 2=4, y=5)) # 调 用 时 使 用 关键 参数 
11 
>>> L= [ (lambda x: x**2), (lambda x: x**3), (lambda x: x**4)] 
>>> print (L[0] (2), L[1] (2), L[2] (2)) 
4816 
>>> D= {'f1': (lambda: 2+3), 'f2': (lambda: 2* 3), '£3": (lambda: 2**3) } 
>>> print (D['f1'] (), D['f2'] (), D['£f3'"] ()) 
568 
>>> L= [1, 2, 3, 4, 5] 
>>> list (map ( (lambda x: x+10), L)) # 没 有 名 字 的 lambda 表达 式 
[11, 12, 13, 14, 15] 
>>> 工 
ti 
>>> def demo (n) : 
return n* n 
>>> demo (5) 
25 
>>> a_list=[1, 2, 3, 4, 5] 
>>> list (map (lambda x: demo (x), a_list)) # 包 含 函 数 调 用 并 且 没 有 名 字 的 lambda 表达 式 
[1, 4, 9, 16, 25] 
>>> data=1ist (range (20) ) 
>>> import random 
>>> random. shuffle (data) 
>>> data 
[4, 3, 11, 13, 12, 15, 9, 2, 10, 6, 19, 18, 14, 8, 0, 7, 5, 17, 1, 16] 
>>> data.sort (key= lambda x: x) # 用 在 列表 的 sort () 方 法 中 
>>> data 
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10}: ys 2p: Bp, GS 16), Fp 1 18; 19) 
>>> data. sort (key= lambda x: len (str (x) ) ) 

>>> data 

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15,16, 17, 18, 19] 
>>> data.sort (key= lambda x: len (str (x)), reverse=True) 

>>> data 

[10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 


在 使 用 lambda 表达 式 时 ,要 注意 变量 作用 域 带 来 的 问题 ,在 下 面 的 代码 中 变量 x 是 在 
外 部 作用 域 中 定义 的 ,对 lambda 表达 式 而 言 不 是 局 部 变量 ,从 而 导致 出 现 了 错误 。 


>>> r=[] 

>>> for x in range(10): 
r.append (lambda: x**2) 

>>> r[0] () 

81 

>>> r[1 

81 


若 修改 为 下 面 的 代码 , 则 可 以 得 到 正确 的 结果 。 


) 


>>> r=[] 

>>> for x in range(10): 
r.append (lambda n=x: n**2) 

>>> r[0] () 

0 

>>> r[1 

1 

>>> r[5 

25 


) 


) 


5.7 案例 精 选 


例 5-1 编写 函数 计算 圆 的 面积 。 


from math import pi as PI 


def CircleArea (r) : 
if isinstance(r, int) or isinstance(r, float): # 确 保 接 收 的 参数 为 数字 
return PI* r* r 
else: 


return ("You must give me an integer or float as radius. ') 


print (CircleArea (3) ) 


例 5-2 编写 函数 ,接收 任意 多 个 实数 ,返回 一 个 元 组 ,其 中 第 一 个 元 素 为 所 有 参数 的 
平均 值 ,其 他 元 素 为 所 有 参数 中 大 于 平均 值 的 实数 。 
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def demo ( * para): 
avg= sum(para) /len (para) # 注 意 Python 2.x 与 Python 3.x 对 除法 运算 符 "/" 的 解释 不 同 
g= [i for i in para if i>avg] 


return (avg, )+ tuple (g) 


print (demo (1, 2, 3, 4)) 


例 5-3 编写 函数 ,接收 字符 串 参 数 ,返回 一 个 元 组 ,其 中 第 一 个 元 素 为 大 写字 母 个 数 ， 
第 二 个 元 素 为 小 写字 母 个 数 。 


def demo (s): 
result= [0, 0] 
for ch in s: 
if 'a'™<=ch<='z': 
result [1]+=1 
elif 'A'<=ch<='2Z': 
result [0]+=1 


return tuple (result) 


print (demo ("aaaabbbbC') ) 


例 5-4 编写 函数 ,接收 包含 20 个 整数 的 列表 lst 和 一 个 整数 k 作为 参数 ,返回 新 列表 。 
处 理 规则 为 : 将 列表 lst 中 下 标 k 之 前 的 元 素 逆 序 , 下 标 k 之 后 的 元 素 逆 序 , 然 后 将 整个 列 
表 Ist 中 的 所 有 元 素 逆 序 。 


def demo (lst, k): 
x=1st[:k] 
x.reverse () 
y= 1st [k:] 
y-reverse () 
r=xty 
r.reverse () 


return r 


lst= list (range (1, 21)) 
print (lst) 
print (demo (1st, 5)) 


例 5-5 E PRC BEC HE ES A tE ERMA PAK t 的 第 一 个 数 。 


def demo (t) : 
a, b=1,1 
while b<t: 
a, b=b, atb 
else: 


return b 
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print (demo (50) ) 


例 5-6 编写 函数 ,接收 一 个 包含 若干 整数 的 列表 参数 lst, 返回 一 个 元 组 ,其 中 第 一 个 
元 素 为 列表 lst 中 的 最 小 值 , 其 余 元 素 为 最 小 值 在 列表 Ist 中 的 下 标 。 


import random 


def demo (lst) : 
m=min (1st) 
result= (m,) 
for index, value in enumerate (lst) : 
if value==m: 
result=result+ (index, ) 


return result 


x= [random.randint (1, 20) for i in range(50)] 
print (x) 
print (demo (x) ) 


例 5-7 E PR. BE — 4 et 为 参数 ,打印 杨辉 三 角 的 前 t 行 。 


def demo (t) : 

print ([1]) 

print([1, 1]) 

line= [1, 1] 

for i in range (2, t): 
r=[] 
for j in range (0, len (line)- 1): 

r.append (line[j]+ line[j+1]) 

line= [1]+ r+ [1] 


print (line) 


demo (10) 


例 5-8 编写 函数 ,接收 一 个 正 偶数 为 参数 ,输出 两 个 素数 ,并 且 这 两 个 素数 之 和 等 于 
原来 的 正 偶数 。 如 果 存 在 多 组 符合 条 件 的 素数 , 则 全 部 输出 。 


import math 


def IsPrime (n) : 
m= int (math.sqrt (n))+1 
for i in range (2, m): 
if n%i==0: 
return False 


return True 


def demo (n) : 


if isinstance(n, int) and n>0 and n&2==0: 
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for i in range(3，int (n/2)+1): 


if i82==1 and IsPrime(i) and IsPrime(n-i): 


画 数 设计 与 使 用 


print(i, '+', n-i, 


demo (60) 


7n) 


例 5-9 编写 函数 ,接收 两 个 正 整数 作为 参数 ,返回 一 个 数组 ,其 中 第 一 个 元 素 为 最 大 


公约 数 , 第 二 个 元 素 为 最 小 公 倍 数 。 


def demo (m, n): 

if mæn: 
m, n=n, m 

p=m*n 

while m!=0: 
r=ntm 
n=m 
mr 


return (n,p//n) 


Print (demo (20, 30)) 


例 5-10 编写 函数 ,接收 一 个 所 有 元 素 值 互 不 相等 的 整数 列表 x 和 一 个 整数 n, 要 求 将 


值 为 n 的 元 素 作为 支点 
元 素 放 到 n 的 后 面 。 


import random 


def demo (x, n): 


if n not in x: 


,将 列表 中 所 有 值 小 于 n 的 元 素 全 部 放 到 n 的 前 面 ,所 有 值 大 于 n 的 


print(n, ' is not an element of ', x) 


return 


i=x.index (n) 
x(0], x[i]=x[i], x[0] 
key=x[0] 


i=0 
j=len(x)-1 


while i<j: 


while i<j and x[j]>=key: 


j-=1 
x[i]=x[j] 


while i<j and x[i]<=key: 


i+=1 


x[j]=x[i] 


# 获 取 指定 元 素 在 列表 中 的 索引 
# 将 指定 元 素 与 第 0 个 元 素 交换 


# 从 后 向 前 寻找 第 一 个 比 指定 元 素 小 的 元 素 


# 从 前 向 后 寻找 第 一 个 比 指定 元 素 大 的 元 素 


133 


《Python 程序 设计 (第 2 版 )》 


x[i]=key 


x= list (range (1, 10)) 
random. shuffle (x) 
print (x) 

demo (x, 4) 

print (x) 


例 5-11 编写 函数 ,计算 字符 串 匹 配 的 准确 率 。 
以 打字 练习 程序 为 例 , 假 设 origin 为 原始 内 容 ,userInput 为 用 户 输入 的 内 容 , 下 面 的 代 
码 用 来 测试 用 户 输入 的 准确 率 。 


def Rate (origin，userInput) : 
if not (isinstance (origin, str) and isinstance(userInput, str)): 
print ('The two parameters must be strings.') 
return 
if len (origin) < len (userInput) : 
print ('Sorry. I suppose the second parameter string is shorter.') 
return 
right=0 # 精 确 匹配 的 字符 个 数 
for origin char, user char in zip (origin，userInput) : 
if origin_char==user_char: 
right +=1 


return right/len (origin) 


origin= 'Shandong Institute of Business and Technology" 
userInput= 'ShanDong institute of business and technolog' 
print (Rate (origin, userInput) ) # 输 出 测试 结果 


5.8 高 级 话题 


在 本 章 的 最 后 ,让 我 们 来 看 几 个 高 级 话题 ,包括 内 置 map() .reduce() \filter()、 生 成 器 、 
Python 字 节 码 、 函 数 嵌 套 定 义 以 及 可 调用 对 象 的 知识 。 

(1) 内 置 函数 map 〇 可 以 将 一 个 单 参数 函数 依次 作用 到 一 个 序列 或 迭代 器 对 象 的 每 个 
元 素 上 ,并 返回 一 个 map 对 象 作为 结果 .其 中 每 个 元 素 是 原 序列 中 元 素 经 过 该 函数 处 理 后 
的 结果 ,该 函数 不 对 原 序列 或 和 代 器 对 象 做 任何 修改 。 


>>> list (map (str, range (5))) 
| ag ete See SET 
>>> def add5 (v) : 
return v+5 
>>> list (map (add5, range(10))) 
[5p Sy. 7, 0; 9; 20), 1, 22; 13), 14) 


(2) Wy PARE reduce 〇 可 以 将 一 个 接收 两 个 参数 的 函数 以 累积 的 方式 从 左 到 右 依 次 作 
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到 一 个 序列 或 选 代 器 对 象 的 所 有 元 素 上 。 


>>> from functools import reduce 


>>> seq= [1, 2, 3, 4, 5, 6, 7, 8, 9] 


>>> reduce (lambda x, y: x+y, seq) 


45 
>>> def add(x, y): ——— 


return x+y 6 


>>> reduce (add, range (10)) 
45 = 
上 面 的 代码 运行 过 程 如 图 5-3 所 示 。 mH 
类 似 的 运算 并 不 局 限于 数值 类 型 ,例如 下 面 4 
的 代码 使 用 前 面 定义 的 函数 add() 实 现 了 字符 串 28 
36 
>>> reduce (add, map (str, range (10))) -= 
"0123456789" (45 ] 


图 5-3 reduce() 函 数 执行 过 程 示意 图 


注意 : 在 Python 2. x 中 ,使 用 reduce() 函 数 
不 需要 先 从 functools 模块 导入 ,可 直接 使 用 。 

(3) WY EPR RM filterO 〇 将 一 个 单 参数 函数 作用 到 一 个 序列 上 ,返回 该 序列 中 使 得 该 函数 
返回 值 为 True 的 那些 元 素 组 成 的 列表 、 元 组 或 字符 串 。 


>>> seq= ['foo"', "x41", '?!', 'x#¥"] 
>>> def func (x): 
return x.isalnum() 
>>> list (filter (func, seq) ) 
['foo', 'x41"] 
['foo', "x41", "21", tee] 
>>> [x for x in seq if x.isalnum()] 
['foo', 'x41'] 
>>> (filter (lambda x: x.isalnum(), seq) ) 
['foo', 'x41'] 


(4) 包含 yield HAH RARU Bl EAE MC ae AEA MI AKRE Ea PE OR AL ,尤其 适用 
于 大 数据 处 理 。 下 面 的 代码 演示 了 如 何 使 用 生成 器 来 生成 斐 波 那 契 数列 。 


>>> def £(): 
a, b=1,1 
while True: 
yielda 
a, b=b, atb 
>>> a=£() 
>>> for i in range (10): 


print(a. next (), end=' ') 
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1123581321 3455 
上 面 定义 的 生成 器 函数 还 可 以 这 样 使 用 : 


>>> for iin £(): 
if i> 100: 
break 
print (i, end=' ') 
1123581321 3455 89 


(5) 使 用 dis 模块 的 功能 可 以 查看 函数 的 字 节 码 指令 。 


>>> def add(n) : 
nt=1 
return n 

>>> import dis 

>>> dis.dis (add) 


2 0 LOAD_FAST 0 (n) 
3 LOAD_CONST 1 (1) 
6 INPLACE_ADD 
7 STORE_FAST 0 (n) 
3 10 LOAD_FAST 0 (n) 


13 RETURN_VALUE 
(6) Pm SE MAG HY IAT Re 
在 Python "Ppa ROE MAREE IY. Ah AEA LS _ call _0O 〇 方法 的 类 的 对 象 都 
FE HAL FALE) AAN. F A AR HE as T PR CHR ES E SL TL: 
def linear (a, b): 
def result (x): 


return a* x+b 


return result 
下 面 的 代码 演示 了 可 调用 对 象 类 的 定义 : 


class linear: 
def init (self, a, b): 
self.a, self.b=a, b 
def call (self, x): 


return self.a* x+ self.b 
使 用 上 面 的 两 种 方式 中 任何 一 个 ,都 可 以 通过 以 下 的 方式 来 定义 一 个 可 调用 对 象 : 
taxes=linear (0.3, 2) 

然后 通过 下 面 的 方式 来 调用 该 对 象 : 
taxes (5) 


下 面 的 代码 完整 地 演示 了 嵌 套 函数 定义 与 使 用 的 方法 ,有 效 利用 了 用 户 名 检查 功能 的 
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def check permission (func) : 
def wrapper (* args, **kwargs) : 
if kwargs.get ("username')! ='admin': 
raise Exception (Sorry. You are not allowed. ') 
return func(* args, **kwargs) 


return wrapper 


class ReadWriteFile (object) : 
# 把 函数 check permission 作为 装饰 器 使 用 
@ check permission 
def read(self, username, filename) : 


return open (filename, 'r') .read() 


def write (self, username, filename, content): 
open (filename, 'a+ ') .write (content) 
# 把 函数 check _permission 作为 普通 函数 使 用 


write=check permission (write) 


t=ReadWriteFile() 

print ('Originally’**') 

print (t.read(username= 'admin', filename=r'd:\sample.txt')) 

print ('Now, try to write to a file… ') 

t.write(username= 'admin', filename=r'd:\sample.txt', content= '\nhello world') 
print ("After calling to write… ') 

print (t.read(username= 'admin', filename=r'd:\sample.txt')) 


AS 章 小 结 


(1) 函数 是 用 来 实现 代码 复 用 的 常用 方式 。 

(2) 定义 函数 时 使 用 关键 字 def, 

(3) 可 以 在 函数 定义 的 开头 部 分 使 用 一 对 三 单 引 号 增加 一 段 注释 来 为 用 户 提 示 函 数 使 
用 说 明 。 

(A) 定义 函数 时 不 需要 指定 其 形 参 类 型 ,而 是 根据 调用 函数 时 传递 的 实 参 自动 推断 。 

(5) 测试 函数 时 ,一 次 或 几 次 运行 正确 并 不 能 说 明 函 数 的 设计 与 实现 没有 问题 ,应 进行 
尽 可 能 全 面 的 测试 。 

(6) 对 于 绝 大 多 数 情 况 , 在 函数 内 部 直接 修改 形 参 的 值 不 会 影响 实 参 。 

(7) 如 果 传 递 给 函数 的 是 Python 可 变 序列 ,并 且 在 函数 内 部 使 用 下 标 或 其 他 方式 为 可 
变 序列 增加 、 删 除 元 素 或 修改 元 素 值 时 ,修改 后 的 结果 是 可 以 反映 到 函数 之 外 的 , 即 实 参 也 
得 到 了 相应 的 修改 。 

(8) 定义 函数 时 可 以 为 形 参 设置 默认 值 , 如 果 调 用 该 函数 时 不 为 默认 值 参 数 传递 参数 ， 
将 自动 使 用 默认 值 。 


137 


函数 设计 与 使 用 


《Python 程序 设计 (第 2 版 )》 


(9) 如 果 使 用 默认 值 参数 ,必须 保证 默认 值 参数 出 现在 函数 参数 列表 中 的 最 后 , 即 默认 
值 参数 后 面 不 能 出 现 非 默认 值 参 数 。 

(10) 多 次 调用 函数 并 且 不 为 默认 值 参 数 传递 值 时 ,默认 值 参数 只 在 第 一 次 调用 时 进行 
解释 ,对 于 列表 字典 这 样 复杂 类 型 的 默认 值 参 数 , 这 一 点 可 能 会 导致 很 严重 的 逻辑 错误 。 

(11) 传递 参数 时 可 以 使 用 关键 参数 ,避免 牢记 参数 顺序 的 麻烦 。 

(12) 定义 函数 时 , 形 参 前 面 加 一 个 星 号 表示 可 以 接收 多 个 实 参 并 将 其 放置 到 一 个 元 组 
中 , 形 参 前 面 加 两 个 星 号 表示 可 以 接收 多 个 “ 键 - 值 对 ”参数 并 将 其 放置 到 字典 中 。 

(13) 为 含有 多 个 变量 的 函数 传递 参数 时 ,可 以 使 用 Python 列表 ,元 组 集合、 字典 以 及 
其 他 可 迁 代 对 象 作为 实 参 , 并 在 实 参 名 称 前 加 一 个 星 号 ,Python 解释 器 将 自动 解 包 , 然 后 传 
递 给 多 个 单 变量 形 参 。 

(14) lambda 表达 式 可 以 用 来 创建 只 包含 一 个 表达 式 的 匿名 函数 。 

(15) 在 lambda 表达 式 中 可 以 调用 其 他 函数 ,并 支持 默认 值 参数 和 关键 参数 。 

(16) 定义 函数 时 不 需要 指定 其 返回 值 的 类 型 ,而 是 由 return 语句 来 决定 ,如 果 函 数 中 
没有 return 语句 或 执行 了 不 返回 任何 值 的 return 语句 , 则 Python 认为 该 函数 返回 空 值 
None。 

(17) 在 函数 内 定义 的 普通 变量 只 在 该 函数 内 起 作用 , 称 为 局 部 变量 。 当 函数 运行 结束 
后 ,在 该 函数 内 部 定义 的 局 部 变量 被 自动 删除 。 在 函数 内 部 定义 的 全 局 变量 当 函 数 结束 以 
后 仍然 存在 并 且 可 以 访问 。 

(18) 在 函数 内 部 可 以 通过 global 关键 字 来 声明 或 者 定义 全 局 变量 。 


习 题 


1. 运行 5.3. 1 节 最 后 的 示例 代码 ,查看 结果 并 分 析 原 因 。 

2. 编写 函数 ,判断 一 个 整数 是 否 为 素数 ,并 编写 主 程序 调用 该 函数 。 

3. 编写 函数 ,接收 一 个 字符 串 ,分 别 统 计 大 写字 母 ,小写 字母 数字、 其 他 字符 的 个 数 ， 
并 以 元 组 的 形式 返回 结果 。 

4. 在 函数 内 部 可 以 通过 关键 字 来 定义 全 局 变量 。 

5. WR ARPA return 语句 或 者 return 语句 不 带 任何 返回 值 ,那么 该 函数 的 返回 
值 为 è 

6. 调用 带 有 默认 值 参 数 的 函数 时 ,不 能 为 默认 值 参数 传递 任何 值 ,必须 使 用 函数 定义 
时 设置 的 默认 值 (判断 对 错 ) 。 

7. 在 Python 程序 中 ,局 部 变量 会 隐藏 同名 的 全 局 变量 吗 ? 请 编写 代码 进行 验证 。 

8. lambda 表达 式 只 能 用 来 创建 匿名 函数 ,不 能 为 这 样 的 函数 起 名 字 ( 判 断 对 错 ) 。 

9. 编写 函数 ,可 以 接收 任意 多 个 整数 并 输出 其 中 的 最 大 值 和 所 有 整数 之 和 。 

10. 编写 函数 ,模拟 内 置 函 数 sum()。 

ll. 包含 语句 的 函数 可 以 用 来 创建 生成 器 。 

12. 编写 函数 ,模拟 内 置 函 数 sorted() 。 
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第 6 章 面向 对 象 程序 设计 


面向 对 象 程序 设计 (Object Oriented Programming,OOP) 的 思想 主要 针对 大 型 软件 设 
计 而 提出 ,使 得 软件 设计 更 加 灵活 ,能够 很 好 地 支持 代码 复 用 和 设计 复 用 ,并 且 使 得 代码 具 
有 更 好 的 可 读 性 和 可 扩展 性 。 面 向 对 象 程序 设计 的 一 条 基本 原则 是 计算 机 程序 由 多 个 能 够 
起 到 子 程序 作用 的 单元 或 对 象 组 合 而 成 ,这 大 大 地 降低 了 软件 开发 的 难度 ,使 得 编程 就 像 拱 
积木 一 样 简单 。 面 向 对 象 程序 设计 的 一 个 关键 性 观念 是 将 数据 以 及 对 数据 的 操作 封装 在 一 
起 ,组 成 一 个 相互 依存 、 不 可 分 割 的 整体 , 即 对 象 。 对 于 相同 类 型 的 对 象 进行 分 类 、 抽 象 后 ， 
得 出 共同 的 特征 而 形成 了 类 ,面向 对 象 程序 设计 的 关键 就 是 如 何 合理 地 定义 和 组 织 这 些 类 
以 及 类 之 间 的 关系 。 

Python 完全 采用 了 面向 对 象 程序 设计 的 思想 ,是 真正 面向 对 象 的 高 级 动态 编程 语言 ， 
完全 支持 面向 对 象 的 基本 功能 ,如 封装 .继承 多 态 以 及 对 基 类 方法 的 覆盖 或 重 写 。 但 与 其 
他 面向 对 象 程序 设计 语言 不 同 的 是 ,Python 中 对 象 的 概念 很 广泛 ,Python 中 的 一 切 内 容 都 
可 以 称 为 对 象 ,而 不 一 定 必 须 是 某 个 类 的 实例 。 例 如 ,字符 串 、 列 表 、 字 典 、 元 组 等 内 置 数据 
类 型 都 具有 和 类 完全 相似 的 语法 和 用 法 。 创 建 类 时 用 变量 形式 表示 的 对 象 属性 称 为 数据 成 
员 或 成 员 属 性 ,用 函数 形式 表示 的 对 象 行为 称 为 成 员 函 数 或 成 员 方 法 ,成 员 属 性 和 成 员 方法 


6.1 类 的 定义 与 使 用 
6.1.1 类 定义 语法 
Python 使 用 class 关键 字 来 定义 类 ,class 关键 字 之 后 是 一 个 空格 ,然后 是 类 的 名 字 , 再 
后 是 一 个 冒号 ,最 后 换行 并 定义 类 的 内 部 实现 。 类 名 的 首 字 母 一 般 要 大 写 ,当然 也 可 以 按照 
自己 的 习惯 定义 类 名 ,但 是 一 般 推荐 参考 惯例 来 命名 ,并 在 整个 系统 的 设计 和 实现 中 保持 风 
格 一 致 ,这 一 点 对 于 团队 合作 尤其 重要 。 例 如 : 


class Car: # 新 式 类 必须 有 至 少 一 个 基 类 
def infor (self): 


print ("This is a car") 


定义 了 类 之 后 ,可 以 用 来 实例 化 对 象 ,并 通过 “对 象 名 . 成 员 ” 的 方式 来 访问 其 中 的 数据 
成 员 或 成 员 方法 ,例如 下 面 的 代码 : 


>>> car=Car() 
>>> car.infor () 


This is a car 


在 Python 中 ,可 以 使 用 内 置 方法 isinstance() 来 测试 一 个 对 象 是 否 为 某 个 类 的 实例 ,下 
面 的 代码 演示 了 isinstance() 的 用 法 。 
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>>> isinstance (car, Car) 
True 
>>> isinstance (car, str) 


False 


最 后 ,Python 提供 了 一 个 关键 字 pass, 类 似 于 空 语句 ,可 以 用 在 类 和 函数 的 定义 中 或 者 
选择 结构 中 。 当 和 暂时 没有 确定 如 何 实现 功能 ,或 者 为 以 后 的 软件 升级 预 留 空间 时 ,可 以 使 用 
该 关键 字 来 “ 占 位 >。 例 如 下 面 的 代码 都 是 合法 的 : 


>>> class A: 


pass 
>>> def demo(): 


pass 
>>> if 5>3: 


pass 


6.1.2 self 参数 


类 的 所 有 实例 方法 都 必须 至 少 有 一 个 名 为 self 的 参数 ,并 且 必 须 是 方法 的 第 一 个 形 参 
(如 果 有 多 个 形 参 ) ,self 参数 代表 对 象 本 身 。 在 类 的 实例 方法 中 访问 实例 属性 时 需要 以 self 
为 前 级 ,但 在 外 部 通过 对 象 名 调用 对 象 方法 时 并 不 需要 传递 这 个 参数 ,如 果 在 外 部 通过 类 名 
调用 对 象 方法 则 需要 显 式 为 self 参数 传 值 ,参考 后 面 6. 2 节 的 讨论 。 
在 Python 中 ,在 类 中 定义 实例 方法 时 将 第 一 个 参数 定义 为 self 只 是 一 个 习惯 ,而 实际 
上 名 字 是 可 以 变化 的 ,而 不 是 必须 使 用 self 这 个 名 字 , 例 如 : 
>>> class A: 
def init (hahaha, v): 
hahaha.value=v 
def show (hahaha) : 
print (hahaha.value) 
>>> a=A(3) 
>>> a.show() 
3 


6.1.3 类 成 员 与 实例 成 员 


这 里 主要 指数 据 成 员 ,或 者 广义 上 的 属性 。 可 以 说 属性 有 两 种 : 一 种 是 实例 属性 ; 另 一 
种 是 类 属性 。 实 例 属性 一 般 是 指 在 构造 函数 init Oy) 中 定义 的 ,定义 和 使 用 时 必须 以 
self 作为 前 级 ;类 属性 是 在 类 中 所 有 方法 之 外 定义 的 数据 成 员 。 在 主 程序 中 (或 类 的 外 部 )， 
实例 属性 属于 实例 (对 象 ), 只 能 通过 对 象 名 访问 ;而 类 属性 属于 类 ,可 以 通过 类 名 或 对 象 名 
访问 。 

在 类 的 方法 中 可 以 调用 类 本 身 的 其 他 方法 ,也 可 以 访问 类 属性 以 及 对 象 属性 。 在 
Python 中 比较 特殊 的 是 ,可 以 动态 地 为 类 和 对 象 增加 成 员 , 这 一 点 是 和 很 多 面向 对 象 程序 
设计 语言 不 同 的 ,也 是 Python 动态 类 型 特点 的 一 种 重要 体现 。 
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class Car: 
price= 100000 # 定 义 类 属性 
def init (self, c): 
self.color=c # 定 义 实例 属性 


carl=Car ("Red") 
car2=Car ("Blue") 


print (carl.color, Car.price) 


Car.price=110000 # 修 改 类 属性 
Car.name= '9Q' # 增 加 类 属性 
carl.color="Yellow" # 修 改 实例 属性 


Print (car2.color, Car.price, Car.name) 
print (carl.color, Car.price, Car.name) 
def setSpeed (self, s): 


self.speed=s 
import types 
carl .setSpeed= types .MethodType (setSpeed, Carl) # 动 态 为 对 象 增 加 成 员 方法 
carl.setSpeed (50) # 调 用 对 象 的 成 员 方法 
print (carl.speed) 


在 Python 中 ,函数 和 方法 是 有 区 别 的 。 方 法 一 般 指 与 特定 实例 绑 定 的 函数 ,通过 对 象 
调用 方法 时 ,对 象 本 身 将 被 作为 第 一 个 参数 传递 过 去 ,普通 函数 并 不 具备 这 个 特点 。 


>>> class Demo: 
pass 
>>> t= Demo () 
>>> def test (self, v): 
self.value=v 
>>>t.test=test 
>>>t.test 
< function test at 0x00000000034B7EA0> 
>>>t.test(t, 3) 
>>> print (t.value) 
3 
>>> t.test= types .MethodType (test, t) 
>>>t.test 
<bound method test of < main .Demo object at 0x000000000074F9E8> > 
>>>t.test (5) 
>>> print (t.value) 
5 


6.1.4 私有 成 员 与 公有 成 员 


Python 并 没有 对 私有 成 员 提供 严格 的 访问 保护 机 制 。 在 定义 类 的 属性 时 ,如 果 属 性 名 
以 两 个 下 划 线 “ “(中间 无 空 ) 开 头 则 表示 是 私有 属性 。 私 有 属性 在 类 的 外 部 不 能 直接 访 
问 ,需要 通过 调用 对 象 的 公有 成 员 方 法 来 访问 ,或 者 通过 Python 支持 的 特殊 方式 来 访问 。 
Python 提供 了 访问 私有 属性 的 特殊 方式 ,可 用 于 程序 的 测试 和 调试 ,对 于 成 员 方法 也 具有 
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同样 的 性 质 。 

私有 属性 是 为 了 数据 封装 和 保密 而 设 的 属性 ,一 般 只 能 在 类 的 成 员 方 法 (类 的 内 部 ) 中 
使 用 访问 ,虽然 Python 支持 一 种 特殊 的 方式 来 从 外 部 直接 访问 类 的 私有 成 员 , 但 是 并 不 推 
荐 这 样 做 。 公 有 属性 是 可 以 公开 使 用 的 , 既 可 以 在 类 的 内 部 进行 访问 ,也 可 以 在 外 部 程序 中 
使 用 。 


>>> class A: 
def init (self, valuel=0, value2=0): 
self. valuel=valuel 
self. value2= value2 
def setValue (self，valuel，value2) : 
self. valuel=valuel 
self. value2=value2 
def show(self) : 
print (self. valuel) 
print (self. value2) 
>>> a=A() 
>>> a._valuel 
0 
>>> a._A_value2 # 在 外 部 访问 对 象 的 私有 数据 成 员 
0 


在 IDLE 环境 中 ,在 对 象 或 类 名 后 面 加 上 一 个 圆 点 ”.”, 稍 等 一 秒 钟 则 会 自动 列 出 其 所 
有 公开 成 员 ,例如 图 6-1 所 示 ,模块 也 具有 同样 的 特点 。 

而 如 果 在 圆 点 .后面 再 加 一 个 下 划 线 , 则 会 列 出 该 对 象 或 类 的 所 有 成 员 ,包括 私有 成 
员 ,如 图 6-2 所 示 。 


图 6-1 列 出 对 象 公开 成 员 图 6-2 列 出 对 象 所 有 成 员 


在 Python 中 ,以 下 划 线 开头 的 变量 名 和 方法 名 有 特殊 的 含义 ,尤其 是 在 类 的 定义 中 。 
用 下 划 线 作为 变量 名 和 方法 名 前 缀 和 后 级 来 表示 类 的 特殊 成 员 。 

(1) _xxx: 这 样 的 对 象 叫 做 保护 成 员 ,不 能 用 “from module import *” 导 入 ,只 有 类 对 
象 和 子 类 对 象 能 访问 这 些 成 员 。 

(2) _ xxx _: 系统 定义 的 特殊 成 员 。 

(3) xxx: 类 中 的 私有 成 员 , 只 有 类 对 象 自己 能 访问 , 子 类 对 象 也 不 能 访问 到 这 个 成 
员 , 但 在 对 象 外 部 可 以 通过 “对 象 名 ._ 类 名 _xxx” 这 样 的 特殊 方式 来 访问 。Python 中 不 存 
在 严格 意义 上 的 私有 成 员 。 
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另外 ,在 IDLE 交互 模式 下 ,一 个 下 划 线 ” “表示 解释 器 中 最 后 一 次 显示 的 内 容 或 最 后 
一 次 语句 正确 执行 的 输出 结果 。 例 如 : 


>>>3+ 5 
8 
>>>_+2 
10 
>>>_* 3 
30 
>>>_/5 
6.0 
>>>1/0 


ZeroDivisionError: integer division or modulo by zero 
>>>_ 
6.0 


下 面 的 代码 演示 了 特殊 成 员 定义 和 访问 的 方法 。 


>>> class Fruit: 
def init__(self): 
self. color= 'Red' 
self.price=1 


>>> apple= Fruit () 


>>> apple.price # 显 示 对 象 公开 数据 成 员 的 值 
1 
>>> apple.price=2 # 修 改 对 象 公开 数据 成 员 的 值 


>>> apple.price 
2 


>>> print (apple.price, apple. Fruit color) # 显 示 对 象 私有 数据 成 员 的 值 

2 Red 

>>> apple. Fruit__color="Blue" # 修 改 对 象 私有 数据 成 员 的 值 

>>> print (apple.price, apple. Fruit color) 

2 Blue 

>>> print (apple.__color) # 不 能 直接 访问 对 象 的 私有 数据 成 员 ,出 错 


AttributeError: Fruit instance has no attribute ' color' 
>>> peach= Fruit () 

>>> print (peach.price, peach. Fruit_ color) 

1 Red 


6.2 Fr 法 


在 类 中 定义 的 方法 可 以 粗略 分 为 四 大 类 : 公有 方法 .私有 方法 、 静 态 方法 和 类 方法 。 其 
中 ,公有 方法 .私有 方法 都 属于 对 象 ,私有 方法 的 名 字 以 两 个 下 划 线 ” “开始 ,每 个 对 象 都 有 
自己 的 公有 方法 和 私有 方法 ,在 这 两 类 方法 中 可 以 访问 属于 类 和 对 象 的 成 员 ;公有 方法 通过 
对 象 名 直接 调用 ,私有 方法 不 能 通过 对 象 名 直接 调用 ,只 能 在 属于 对 象 的 方法 中 通过 self 调 
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用 或 在 外 部 通过 Python 支持 的 特殊 方式 来 调用 。 如 果 通 过 类 名 来 调用 属于 对 象 的 公有 方 
法 ,需要 显 式 为 该 方法 的 self 参数 传递 一 个 对 象 名 ,用 来 明确 指定 访问 哪个 对 象 的 数据 成 
员 。 静 态 方法 和 类 方法 都 可 以 通过 类 名 和 对 象 名 调用 ,但 不 能 直接 访问 属于 对 象 的 成 员 , 只 
能 访问 属于 类 的 成 员 。 一 般 将 cls 作为 类 方法 的 第 一 个 参数 名 称 ,但 也 可 以 使 用 其 他 的 名 
字 作 为 参数 ,并 且 在 调用 类 方法 时 不 需要 为 该 参数 传递 值 。 例 如 : 


>>> class Root: 
_ total=0 
def init__(self, v): 
self. value=v 


Root. _total+=1 


def show (self): 
Print('self. value:', self. value) 


Print('Root. total:', Root. total) 


@ classmethod 
def classShowTotal (cls): # 类 方法 
print(cls. total) 


@ staticmethod 
def staticShowTotal () : # 静 态 方法 
print (Root. total) 

>>> r= Root (3) 
>>> r.classShowTotal () # 通 过 对 象 来 调用 类 方法 
1 
>>> r.staticShowTotal () # 通 过 对 象 来 调用 静态 方法 
1 
>>> r.show() 
self. value: 3 
Root. total: 1 
>>> rr= Root (5) 
>>> Root .classShowTotal () # 通 过 类 名 调用 类 方法 


2 


>>> Root .staticshowTotal () # 通 过 类 名 调用 静态 方法 

2 

>>> Root . show () # 试 图 通过 类 名 直接 调用 实例 方法 ,失败 

TypeError: unbound method show () must be called with Root instance as first argument (got 
nothing instead) 

>>> Root .show (r) # 可 以 通过 这 种 方法 来 调用 方法 并 访问 实例 成 员 

self. value: 3 

Root. total: 2 

>>> r.show() 

self. value: 3 


Root. total:2 
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>>> Root . show (rr) # 通 过 类 名 调用 实例 方法 时 为 self 参数 显 式 传递 对 象 名 
self. value: 5 

Root. total: 2 

>>> rr.show() 

self. value: 5 


Root. total: 2 


6.3 属 性 


Python 2. x 和 Python 3. x 对 属性 的 实现 和 处 理 方式 不 一 样 ,内 部 实现 有 较 大 的 差异 ， 
使 用 时 应 注意 二 者 之 间 的 区 别 。 本 节 中 讨论 的 “属性 ” 指 狭义 的 概念 ,与 前 面 所 谈 的 “属性 ” 
概念 并 不 完全 一 样 。 


6.3.1 Python 2.x 中 的 属性 


在 Python 2. x 中 ,使 用 @property 或 property() 函 数 来 声明 一 个 属性 ,然而 属性 并 没 
有 得 到 真正 意义 的 实现 ,也 没有 提供 应 有 的 访问 保护 机 制 。 正 如 前 面 所 说 ,在 Python 中 ， 
可 以 为 类 和 对 象 动态 增加 新 成 员 。 在 Python 2. x 中 ,为 对 象 增加 新 的 数据 成 员 时 ,将 隐藏 
同名 的 已 有 属性 。 例 如 ,下 面 的 Python 2.7.11 代码 : 


>>> class Test: 
def init__(self, value): 


self. value=value 


@property 
def value (self): 
return self. value 
>>> a= Test (3) 
>>> a.value 
3 
>>> a.value=5 # 动 态 添加 了 新 成 员 ,隐藏 了 定义 的 属性 
>>> a.value 
5 
>>> t. Test_ value # 原 来 的 私有 变量 没有 改变 
3 


除了 动态 增加 成 员 时 会 隐藏 已 有 属性 ,下 面 的 代码 从 表面 看 来 是 修改 属性 的 值 ,而 实际 上 也 
是 增加 了 新 成 员 , 从 而 隐藏 了 已 有 属性 。 
>>> class Test: 


def init__(self, value): 


self. value=value 


def get(self): 


return self. value 
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def set (self, v): 


self. value=v 


value=property( get, _set) 


def show(self) : 
print self. value 
>>> t=Test (3) 
>>> 七 .Value 


3 

>>> t.valuet=2 # 动 态 添加 新 成 员 

>>> t.value # 这 里 访问 的 是 新 成 员 

5 

>>> 上 .show () # 访 问 原来 定义 的 私有 数据 成 员 

3 

>>> del t.value # 这 里 删除 的 是 刚才 添加 的 新 成 员 
>>> t.value # 访 问 原来 的 属性 

3 

>>> del t.value # 试 图 删除 属性 

AttributeError: Test instance has no attribute 'value' 

>>> del t. Test value # 删 除 私有 成 员 

>>> t.value # 访 问 属性 ,但 该 属性 对 应 的 私有 成 员 已 不 存在 


AttributeError: Test instance has no attribute ' Test value' 
下 面 的 代码 则 更 加 清楚 地 演示 了 Python 2. x 中 私有 成 员 和 普通 成 员 之 间 的 关系 。 


>>> class Test: 
def show(self): 
print self.value 
print self. v 
>>> t=Test () 
>>> t.show() 
AttributeError: Test instance has no attribute 'value' 
>>> t.value=3 
>>> t.show() 
3 
AttributeError: Test instance has no attribute ' Test_v' 
>>> t._v=5 
>>> t.show() 
3 
AttributeError: Test instance has no attribute ' Test_v" 
>>> t. Test v5 
>>> t.show() 
3 
5 
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6.3.2 Python 3.x 中 的 属性 


在 Python 3.x 中 ,属性 得 到 了 较为 完整 的 实现 ,支持 更 加 全 面 的 保护 机 制 。 例 如 下 面 
的 代码 所 示 ,如 果 设 置 属性 为 只 读 , 则 无 法 修改 其 值 ,也 无 法 为 对 象 增加 与 属性 同名 的 新 成 
员 , 同 时 ,也 无 法 删除 对 象 属性 。 例 如 ,下 面 的 代码 运行 在 Python 3.5.1 P: 


>>> class Test: 
def init (self, value): 


self. value=value 


@property 
def value (self): # 只 读 , 无 法 修改 和 删除 
return self. value 
>>> t= Test (3) 


>>> t.value 

3 

>>> t.value=5 # 只 读 属 性 不 允许 修改 值 
AttributeError: can't set attribute 

>>> t.v=5 # 动 态 增加 新 成 员 

>>> t.v 

5 

>>> del t.v # 动 态 删除 成 员 

>>> del t.value # 试 图 删除 对 象 属性 ,失败 
AttributeError: can't delete attribute 

>>> t.value 

3 


下 面 的 代码 则 把 属性 设置 为 可 读 、 可 修改 ,而 不 允许 删除 。 


>>> class Test: 
def init (self, value): 


self. value=value 


def get (self): 


return self. value 


def _set(self, v): 


self. value=v 
value=property(_ get, _ set) 


def show(self) : 
print (self. value) 

>>> t=Test (3) 

>>> t.value # 人 允许 读 取 属 性 值 

3 
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>>> t.value=5 # 人 允许 修改 属性 值 

>>> t.value 

5 

>>> t. show () # 属 性 对 应 的 私有 变量 也 得 到 了 相应 的 修改 
i 

>>> del t.value # 试 图 删除 属性 ,失败 


AttributeError: can't delete attribute 
当然 ,也 可 以 将 属性 设置 为 可 读 、 可 修改 .可 删除 。 


>>> class Test: 
def init__(self, value): 


self. value=value 


def __get (self): 


return self. value 


def __set(self, v): 


self. value=v 


def __del (self): 


del self. value 
value=property(_ get, _ set, del) 


def show(self): 
print (self. value) 

>>> t=Test (3) 
>>> t.show() 
3 
>>> t.value 
3 
>>> t.value=5 
>>> t.show() 
5 
>>> t.value 
5 
>>> del t.value 
>>> t.value 
AttributeError: "Test' object has no attribute ' Test value' 
>>> t.show() 
AttributeError: 'Test' object has no attribute ' Test_ value" 


>>> t.value=1 # 为 对 象 动态 增加 属性 和 对 应 的 私有 数据 成 员 


>>> t.show() 
1 
>>> t.value 
1 
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6.4 ”特殊 方法 与 运算 符 重 载 * 
6.4.1 常用 特殊 方法 


Python 类 有 大 量 的 特殊 方法 ,其 中 比较 常见 的 是 构造 函数 和 析 构 函数 。Python 中 类 
的 构造 函数 是 _ init LO ,一 般 用 来 为 数据 成 员 设置 初 值 或 进行 其 他 必要 的 初始 化 工作 ,在 
创建 对 象 时 被 自动 调用 和 执行 ,可 以 通过 为 构造 函数 定义 默认 值 参数 来 实现 类 似 于 其 他 语 
言 中 构造 函数 重 载 的 目的 。 如 果 用 户 没有 设计 构造 函数 ,Python 将 提供 一 个 默认 的 构造 函 
数 用 来 进行 必要 的 初始 化 工作 。Python 中 类 的 析 构 函数 是 del _0 〇 ,一般 用 来 释放 对 象 
占用 的 资源 ,在 Python 删除 对 象 和 收回 对 象 空间 时 被 自动 调用 和 执行 。 如果 用 户 没 有 编 
写 析 构 函数 ,Python 将 提供 一 个 默认 的 析 构 函数 进行 必要 的 清理 工作 。 

在 Python 中 ,除了 构造 函数 和 析 构 函数 之 外 ,还 有 大 量 的 特殊 方法 支持 更 多 的 功能 ,例如 
运算 符 重 载 就 是 通过 在 类 中 重 写 特殊 函数 来 实现 的 。 表 6-1 列 出 了 其 中 一 部 分 Python 类 特 
殊 方法 。 


表 6-1 Python 类 特殊 方法 


方 法 功能 说 明 

_init_O 构造 函数 ,生成 对 象 时 调用 
_del © 析 构 函数 ,释放 对 象 时 调用 
_add (), radd () e+ a+ 
_sub_() 一 
_mul_() * 
__div__O,_truediv_O / Python 2. x 使 用 _div_0O 〇 ,Python 3.x 使 用 _truediv_ () 
__floordiv__O 整除 
__mod_© % 
__pow_ () aw 
_cmp_() 比较 运算 
_repr_() 打印 .转换 
__setitem__© 按照 索引 赋值 
__getitem_ 按照 索引 获取 值 
_len_O 计算 长 度 
_call_ O 函数 调用 
contains ©, 测试 是 否 包含 某 个 元 素 
aa eee i ss Paani 
_str_O 转化 为 字符 串 
Ishift O,_rshift_O <<>> 

and O,_or_O,_invet_O | &、|、 一 
_iadd ()、isub © 生生 二 一 
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6.4.2 案例 精 选 


例 6-1 自 定义 一 个 数组 类 ,支持 数组 与 数字 之 间 的 四 则 运算 ,数组 之 间 的 加 法 运算 、 
内 积 运 算 和 大 小 比较 ,数组 元 素 访问 和 修改 ,以 及 成 员 测 试 等 功能 。 


class MyArray: 
"All the elements in this array must be numbers™ 
_ value= [] 


__size=0 


def _IsNumber (self, n): 
if (not isinstance(n, int)) and \ 
(not isinstance(n, float)) and \ 
(not isinstance(n, complex) ): 
return False 


return True 


def init__(self, * args): 
if not args: 
self. value= [] 
else: 
for arg in args: 
if not self. IsNumber (arg): 
print ('All elements must be numbers') 
return 


self. value=list (args) 


def _add__(self, n): # 数 组 中 每 个 元 素 都 与 数字 n 相 加 ,或 两 个 数组 相 加 
if self. IsNumber (n) : 
b=MyArray () 
for v in self. value: 
b.__value.append(v +n) 
return b 
elif isinstance(n, MyArray): 
if len(n. value)==len(self.__ value): 
c=MyArray () 
for i, j in zip(self. value, n._ value): 
c.__value.append (i+ j) 
return c 
else: 
print ("Lenght not equal') 
else: 


print ("Not supported") 


def sub (self, n): # 数 组 中 每 个 元 素 都 与 数字 n 相 减 ,返回 新 数组 
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def 


def 


def 


def 


def 


if not self. IsNumber (n) : 
print ('- operating with', type(n), ‘and number type is not supported. ') 
return 

b=MyArray () 

for v in self. value: 
b.__value.append (v- n) 


return b 


_ mul (self, n): # 数 组 中 每 个 元 素 都 与 数字 n 相 乘 ,返回 新 数组 


if not self. IsNumber (n) : 
print('* operating with', type(n), 'and number type is not supported. ') 
return 

b=MyArray () 

for v in self. value: 
b.__value.append (v * n) 


return b 


__truediv__(self, n): # 数 组 中 每 个 元 素 都 与 数字 n 相 除 , 返 回 新 数组 


if not self. IsNumber (n) : 
print (r'/ operating with', type(n), ' and number type is not supported.') 
return 

b=MyArray () 

for vin self. value: 
b._ value.append (v/n) 


returnb 


_ floordiv (self, n): # 数 组 中 每 个 元 素 都 与 数字 n 整除 ,返回 新 数组 


if not isinstance(n, int): 
print(n, ' is not an integer") 
return 

b=MyArray () 

for vin self. value: 
b.__value.append (v//n) 


return b 


_ mod (self, n): # 数 组 中 每 个 元 素 都 与 数字 n 求 余数 ,返回 新 数组 


if not self. IsNumber (n) : 
print (r'% operating with', type(n), ' and number type is not supported.') 
return 

b=MyArray () 

for v in self. value: 
b.__value.append (v% n) 


return b 


_ pow (self, n): # 数 组 中 每 个 元 素 都 与 数字 n 进行 短 计 算 , 返 回 新 数组 
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return b 
def len (self): 
return len(self. value) 
def __repr__(self): # 直 接 使 用 对 象 作为 语句 时 调用 该 函数 
#equivalent to return ‘self. value” 
return repr (self. value) 
def str__(self): # 使 用 print () 函 数 输出 对 象 时 调用 该 函数 
return str(self. value) 
def append (self, v): # 追 加 元 素 
if not self. IsNumber(v): 
print ("Only number can be appended. ') 
return 
self. value.append (v) 
def getitem (self, index): # 获 取 指 定位 置 的 元 素 值 
if self. IsNumber (index) and 0<=index<len(self.__ value): 
return self. value [index] 
else: 
print ("Index out of range.') 
def _setitem_ (self, index, v): ## 设 置 指定 位 置 的 元 素 值 
if not self. IsNumber(v): 
print(v, ' is not a number') 
elif (not isinstance (index, int)) or index<0 or index>=len(self._ value): 
print ("Index type error or out of range') 
else: 
self. value[index]=v 
def contains (self, v): # 成 员 测试 运算 符 in 
if v in self. value: 
return True 
return False 
def dot (self, v): # 模 拟 向 量 内 积 


if not self. IsNumber (n) : 


print ('** operating with', type(n), ' and number type is not supported.') 


return 
b=MyArray () 
for v in self. value: 


b.__value.append (v xx n) 


if not isinstance(v, MyArray) : 


print (v, ' must be an instance of MyArray.') 


return 

if len(v) !=len(self. value): 
print ("The size must be equal. ') 
return 


b=MyArray () 


for m, nin zip(v. value, self. value): 


b.__value.append(m * n) 


return sum(b. value) 


def _eq__(self, v): # 关 系 运算 符 == 


if not isinstance(v, MyArray) : 


print (v, ' must be an instance of MyArray.') 


return False 


if self. value ==v._ value: 
return True 


return False 


def _lt__(self, v): # 关 系 运算 符 < 


if not isinstance(v, MyArray): 


print (v, ' must be an instance of MyArray.') 


return False 
if self. value <v._ value: 
return True 


return False 


if name =='_ main _': 


print ("Please use me as a module.') 


将 上 面 的 程序 保存 为 MyArray. py 文件 ,可 以 作为 Python 模块 导入 并 使 用 其 中 的 数 


>>> from MyArray import MyArray 
>>>x=MyArray(1, 2, 3, 4, 5, 6) 
>>> y=MyArray (6, 5, 4, 3, 2, 1) 
>>> len (x) 

6 

>>>x +5 

[6, 7, 8, 9, 10, 11] 

>>>x * 3 

[3, 6, 9, 12, 15, 18] 
>>>x.dot (y) 

56 

>>> x.append (7) 

>>>x 

[1, 2, 3, 4, 5, 6, 7] 
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>>>x.dot (y) 

The size must be equal. 
>>>x[9]=8 

Index type error or out of range 
>>>x/2 

[0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5] 
>>>x // 2 

[0, 1, 1, 2, 2, 3, 3] 

>>x$% 3 

(1, 2, 0, 1, 2, 0, 1] 

>>>x([2] 

3 

>>>'a' inx 

False 

>>>3 inx 

True 

>>>x <y 

True 

>>>x=MyArray(1, 2, 3, 4, 5, 6) 
>>>x +y 

[7, 7, 7, 7, 7, 7) 


6.5 继承 机 制 


继承 是 为 代码 复 用 和 设计 复 用 而 设计 的 ,是 面向 对 象 程序 设计 的 重要 特性 之 一 。 当 设 
计 一 个 新 类 时 ,如 果 可 以 继承 一 个 已 有 的 设计 良好 的 类 然后 进行 二 次 开发 ,无疑 会 大 幅度 减 
少 开发 工作 量 。 在 继承 关系 中 ,已 有 的 .设计 好 的 类 称 为 父 类 或 基 类 ,新 设计 的 类 称 为 子 类 
或 派生 类 。 派 生 类 可 以 继承 父 类 的 公有 成 员 , 但 是 不 能 继承 其 私有 成 员 。 如 果 需 要 在 派生 
类 中 调用 基 类 的 方法 ,可 以 使 用 内 管 函 数 super() 或 者 通过 * 基 类 名 . 方法 名 () ”的 方式 来 

Python 支持 多 继承 ,如 果 父 类 中 有 相同 的 方法 名 ,而 在 子 类 中 使 用 时 没有 指定 父 类 名 ， 
则 Python 解释 器 将 从 左 向 右 按 顺序 搜索 。 

例 6-2 在 派生 类 中 调用 基 类 方法 。 

首先 设计 Person 类 ,然后 以 Person 为 基 类 派生 Teacher 类 ,分 别 创建 Person 类 和 
Teacher 类 的 对 象 ,并 在 派生 类 对 象 中 调用 基 类 方法 。 


class Person (object) : # 必 须 以 cbject 为 基 类 
def init (self, name='', age=20, sex='man'): 
self.setName (name) 
self.setAge (age) 


self.setSex (sex) 


def setName (self, name) : 
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if not isinstance (name，str) : 
print ("name must be string.') 
return 


self. name=name 


def setAge (self, age): 
if not isinstance(age, int): 
print ("age must be integer.') 
return 


self. age=age 


def setSex (self, sex): 
if sex !='man' and sex != "woman': 
print ('sex must be "man" or "woman"') 
return 


self. sex=sex 


def show(self): 
print ('Name:', self. name) 
print ('Age:', self. age) 


print ('Sex:', self. sex) 


# 派 生 类 


class Teacher (Person): 
age= 30, sex='man', department= 'Computer"): 


def init__(self, name='', 
super (Teacher, self). init (name, age, sex) 
##or, use another method like below: 
#Person. init (self, name, age, sex) 


self.setDepartment (department) 


def setDepartment (self, department) : 
if not isinstance (department, str): 
print ("department must be a string.') 
return 


self. department=department 


def show(self): 
super (Teacher, self) .show() 
print ('Department:', self. department) 


if name ==' main _': 
zhangsan= Person ("Zhang San', 19, 'man') 
zhangsan. show () 
lisi=Teacher ("Li Si',32, 'man', 'Math') 
lisi.show() 


lisi.setAge (40) 
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lisi.show() 


为 了 更 好 地 理解 Python 类 的 继承 机 制 , 再 来 看 下 面 的 代码 ,并 认真 体会 构造 函数 、 私 
有 方法 和 普通 公开 方法 的 继承 原理 。 


>>> class A(object): 
def init (self): 
self. private () 
self.public () 
def private (self): 
print(' Private () method in A') 
def public (self): 
print ("public() method in A') 
>>>class B(A) : # 注 意 ,类 B 没 有 定义 构造 函数 
def _ private (self): 
print ('__private() method in B') 
def public (self): 
print ('public() method in B') 
>>>b=B() 
__private() method in A 
public() method in B 
>>> dir (b) 
['_A_private', ' B private', '_class_', ...] 
>>>class C(A): 
def init__(self): # 显 式 定义 构造 函数 
self. private() 
self.public() 
def _ private (self): 
print ('__private() method in C') 
def public (self): 
print ("public() method in C') 
>>>c=C() 
__private() method in C 
public() method in C 
>>>dir(c) 


['_A_private', ' C private', '_ class_', ...] 


本 意 小 结 


CL) 面向 对 象 程序 设计 (Object Oriented Programming,OOP) 的 思想 主要 针对 大 型 软 
件 设 计 而 提出 ,使 得 软件 设计 更 加 灵活 ,能 够 很 好 地 支持 代码 复 用 和 设计 复 用 ,并 且 使 得 代 
码 具 有 更 好 的 可 读 性 和 可 扩展 性 。 

(2) 定义 类 时 使 用 关键 字 class。 

(3) 可 以 动态 地 为 类 和 对 象 增加 成 员 。 
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(4) 类 中 所 有 实例 方法 都 至 少 包含 一 个 self 参数 ,并且 必 须 是 第 一 个 参数 ,用 来 表示 对 
象 本 身 , 通 过 对 象 名 调用 实例 方法 时 不 需要 为 self 参数 传递 任何 值 。 

(5) 实例 属性 一 般 是 指 在 构造 函数 _ init _() 中 定义 的 ,定义 时 以 self 作为 前 级 ;类 属 
性 是 在 类 中 所 有 方法 之 外 定义 的 数据 成 员 。 

(6) 如 果 通 过 类 名 来 调用 属于 对 象 的 公有 方法 ,需要 显 式 为 该 方法 的 self 参数 传递 一 
个 对 象 名 ,用 来 明确 指定 访问 哪个 对 象 的 数据 成 员 。 

(7) Python 2. x 中 的 属性 没有 提供 完整 的 保护 机 制 , 在 Python 3. x 中 得 到 了 完整 的 
实现 。 

(8) 在 Python 中 ,运算 符 重 载 是 通过 重新 实现 一 些 特殊 函数 来 实现 的 。 

(9) Python 支持 多 继承 ,如 果 多 个 父 类 中 有 相同 名 字 的 成 员 , 而 在 子 类 中 使 用 该 成 员 
时 没有 指定 其 所 属 父 类 名 , 则 Python 解释 器 将 从 左 向 右 按 顺序 进行 搜索 。 

(10) 在 Python 中 ,以 下 划 线 开头 的 变量 名 有 特殊 的 含义 ,尤其 是 在 类 的 定义 中 。 

(11) 在 IDLE 交互 式 环境 中 ,单个 下 划 线 表示 上 次 语句 正常 执行 的 输出 结果 。 


习 题 
1. 继承 6. 5 节 例 6-2 中 的 Person 类 生成 Student 类 ,编写 新 的 函数 用 来 设置 学 生 专 


业 , 然 后 生成 该 类 对 象 并 显示 信息 。 
2. 设计 一 个 三 维 向 量 类 ,并 实现 向 量 的 加 法 、 减 法 以 及 向 量 与 标量 的 乘法 和 除法 运算 。 


3. 面向 对 象 程序 设计 的 三 要 素 分 别 为 、 和 。 

4. 简单 解释 Python 中 以 下 划 线 开头 的 变量 名 特点 。 

5. 与 运算 符 “**” 对 应 的 特殊 方法 名 为 ,与 运算 符 “//” 对 应 的 特殊 方法 名 
为 。 


6. 假设 a 为 类 A 的 对 象 且 包含 一 个 私有 数据 成 员 *_ value”, 那 么 在 类 的 外 部 通过 对 
Ra 直接 将 其 私有 数据 成 员 ”_ value” 的 值 设置 为 3 的 语句 可 以 写作 
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为 了 长 期 保存 数据 以 便 重复 使 用 .修改 和 共享 ,必须 将 数据 以 文件 的 形式 存储 到 外 
部 存储 介质 (如 磁盘 、U 盘 、 光 盘 等 ) 或 云 盘 中 。 管 理 信息 系统 是 使 用 数据 库 来 存储 数据 
的 ,而 数据 库 最终 还 是 要 以 文件 的 形式 存储 ,应 用 程序 的 配置 信息 往往 也 是 使 用 文件 来 
存储 的 ,图 形 、 图 像 、 音 频 、 视 频 、 可 执行 文件 等 也 都 是 以 文件 的 形式 存储 的 。 因 此 ,文件 
操作 在 各 类 应 用 软件 的 开发 中 均 占有 重要 的 地 位 。 

按 文件 中 数据 的 组 织 形式 可 以 把 文件 分 为 文本 文件 和 二 进 制 文件 两 大 类 。 

1. 文本 文件 

文本 文件 存储 的 是 常规 字符 串 , 由 若干 文本 行 组 成 ,通常 每 行 以 换行 符 \n' 结 尾 。 常 规 
字符 串 是 指 记事 本 或 其 他 文本 编辑 器 能 正常 显示 、 编 辑 并 且 人 类 能 够 直接 阅读 和 理解 的 字 
符 串 ,如 英文 字母 .汉字 数字 字符 串 。 文 本 文件 可 以 使 用 字 处 理 软 件 , 如 gedit、 记 事 本 进行 
编辑 。 

2. 二 进 制 文件 

二 进 制 文件 把 对 象 内 容 以 字 节 串 (bytes) 进 行 存 储 , 无 法 用 记事 本 或 其 他 普通 文本 处 理 
软件 直接 进行 编辑 ,通常 也 无 法 被 人 类 直接 阅读 和 理解 ,需要 使 用 专门 的 软件 进行 解码 后 读 
取 、 显 示 、 修 改 或 执行 。 常 见 的 如 图 形 图 像 文件 . 音 视频 文件 .可 执行 文件 .资源 文件 .各 种 数 
据 库 文件 .各 类 Office 文档 等 都 属于 二 进 制 文件 。 


7.1 文件 对 象 


无 论 是 文本 文件 还 是 二 进 制 文件 ,其 操作 流程 基本 都 是 一 致 的 , 即 : 首先 打开 文件 并 创 
建文 件 对 象 ,然后 通过 该 文件 对 象 对 文件 内 容 进 行 读 取 、 写 入 、 删 除 、 修 改 等 操作 ,最 后 关闭 
并 保存 文件 内 容 。Python 内 团 了 文件 对 象 ,通过 open() 函 数 即 可 以 指定 模式 打开 指定 文 
件 并 创建 文件 对 象 , 例 如 : 


文件 对 象 名 = open (文件 名 [, 打开 方式 [, 缓冲 区 ]]) 


其 中 ,文件 名 指定 了 被 打开 的 文件 名 称 , 如 果 要 打开 的 文件 不 在 当前 目录 中 ,还 需要 指定 完 
整 路 径 , 为 了 减少 完整 路 径 中 “\” 符 号 的 输入 ,可 以 使 用 原始 字符 串 ; 打 开 模 式 ( 见 表 7-1) 指 
定 了 打开 文件 后 的 处 理 方式 ,例如 “只 读 ”“ 读 写 ”“ 追 加 ”等 ;缓冲 区 指定 了 读 写 文件 的 缓存 
模式 ,数值 0 表示 不 缓存 ,数值 1 表示 缓存 ,如 大 于 1 则 表示 缓冲 区 的 大 小 ,默认 值 是 缓存 模 
式 。 如 果 执 行 正常 ,open() 函 数 返回 1 个 文件 对 象 , 通 过 该 文件 对 象 可 以 对 文件 进行 各 种 操 
NE ,如果 指 定 文件 不 存在 、 访 问 权限 不 够 磁盘 空间 不 够 或 其 他 原因 导致 创建 文件 对 象 失败 
则 抛 出 异常 。 例 如 ,下 面 的 代码 分 别 以 读 、 写 方式 打开 了 两 个 文件 并 创建 了 与 之 对 应 的 文件 
对 象 。 


fl=open('filel.txt', 'r') 
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f2=open('file2.txt', 'w') 
当 对 文件 内 容 操作 完 以 后 ,一 定 要 关闭 文件 ,以 保证 所 做 的 任何 修改 都 得 到 保存 。 
fl.close() 


文件 对 象 常用 属性 如 表 7-2 所 示 。 


表 7-1 文件 打开 模式 表 7-2 文件 对 象 属性 
模式 说 明 属 性 说 明 
r | 读 模式 bed | 判断 文件 是 否 关闭 , 若 文件 被 关闭 ， 
w | 写 模 式 “| 则 返回 True 
Ts de | 返回 文件 的 打开 模式 
b | 三 进 制 模式 (可 与 其 他 模式 组 合 使 用 ) 
+ | 读 、 写 模式 (可 与 其 他 模式 组 合 使 用 ) name | 返回 文件 的 名 称 


文件 对 象 常用 方法 如 表 7-3 所 示 。 
表 7-3 文件 对 象 常用 方法 


方 法 功能 说 明 
flushO 把 缓冲 区 的 内 容 写 入 文件 ,但 不 关闭 文件 
close) 把 缓冲 区 的 内 容 写 人 文件 ,同时 关闭 文件 ,并 释放 文件 对 象 


从 文件 中 读 取 size 个 字 节 (Python 2. x) 或 字符 (Python 3. x) 的 内 容 作为 结 
果 返 回 , 如 果 省 略 size, 则 表示 一 次 性 读 取 所 有 内 容 


readline) 从 文本 文件 中 读 取 一 行内 容 作为 结果 返回 
readlines() 把 文本 文件 中 的 每 行文 本 作为 一 个 字符 串 存 人 列表 中 ,返回 该 列表 


把 文件 指针 移动 到 新 的 位 置 ,offset 表示 相对 于 whence 的 位 置 。whence 为 
seek(offset[, whence]) 0 表示 从 文件 头 开始 计算 ,1 表示 从 当前 位 置 开始 计算 ,2 表示 从 文件 尾 开 


read([size]) 


始 计算 ,默认 为 0 

tellO 返回 文件 指针 的 当前 位 置 

tidabatet sie) 删除 从 当前 指针 位 置 到 文件 末尾 的 内 容 。 如 果 指 定 了 size, 则 不 论 指 针 在 
什么 位 置 都 只 留 下 前 size 个 字 节 ,其 余 的 删除 

write(s) 把 字符 串 s 的 内 容 写 和 人 文件 

writelines(s) 把 字符 串 列表 写 人 文本 文件 ,不 添加 换行 符 


7.2 文本 文件 操作 案例 精 选 


在 本 节 中 ,主要 通过 几 个 示例 来 演示 文本 文件 的 读 写 操作 。 对 于 read()、write() 以 及 
其 他 读 写 方法 , 当 读 写 操作 完成 之 后 ,都 会 自动 移动 文件 指针 ,如 果 需 要 对 文件 指针 进行 定 
位 ,可 以 使 用 seekQ 〇 方法 ,如 果 需 要 获知 文件 指针 当前 位 置 可 以 使 用 tell() 方 法 。 

例 7-1 向 文本 文件 中 写 和 人 内容。 
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f=open('sample.txt', 'a+') 
== "文本 文件 的 读 取 方 法 \n 文 本 文件 的 写 人 方法 \n' 
f.write(s) 


f.close() 
对 于 上 面 的 代码 ,建议 写 为 如 下 形式 : 
s= ' 文 本 文件 的 读 取 方法 \n 文 本 文件 的 写 入 方法 \n' 


with open('sample.txt', 'at') as f: 


£.write(s) 


使 用 上 下 文 管理 关键 字 with 可 以 自动 管理 资源 ,不 论 何 种 原因 跳出 with 块 ,总 能 保证 
文件 被 正确 关闭 ,并 且 可 以 在 代码 块 执行 完毕 后 自动 还 原 进入 该 代码 块 时 的 现场 。 

例 7-2 读 取 并 显示 文本 文件 的 前 5 个 字 节 。 

对 于 文件 对 象 的 read() 方 法 ,Python 2. x Al Python 3. x 的 解释 略 有 不 同 , 尤 其 是 文本 
文件 中 包含 中 文 的 时 候 。Python 2. x 的 read() 方 法 是 读 取 文 件 中 指定 数量 的 字 节 ,对 于 中 
文 可 能 会 由 于 无 法 正常 解码 而 出 现 乱 码 。 例 如 ,假设 sample, txt 文件 内 容 为 “SDIBT 中 国 
山东 烟台 ”, 那 么 在 Python 2.7.11 中 代码 运行 结果 如 下 : 


>>> fp=open('sample.txt', 'r') 
>>> print fp.read (5) 

SDIBT 

>>> print fp.read (7) 

Ona 
>>> print fp.read (8) 
ni 


>>> fp.close () 


而 Python 3. x 对 中 文 支持 较 好 ,对 read() 方 法 的 解释 是 读 取 文件 中 指定 数量 的 字符 而 
不 是 字 节 ,对 中 文 和 英文 字母 同等 对 待 。 对 前 述 sample. txt 文件 ,Python 3. 5. 1 中 代码 运 
行 结果 如 下 : 


>>> fp=open('sample.txt', 'r') 
>>> print (fp.read (5) ) 

SDIBT 

>>> print (fp.read (7) ) 

中 国 山 东 烟 台 

>>> fp.seek (0) 

0 

>>> print (fp.read (8) ) 

SDIBT 中 国 山 


例 7-3 读 取 并 显示 文本 文件 所 有 行 。 


f=open('sample.txt', 'r') 
while True: 


line=£.readline () 
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if line==": 
break 
print (line, end= ") 


f£.close() 
当然 ,也 可 以 写作 : 


f=open('sample.txt', 'r') 
1i=£.readlines () 
for line in li: 

print (line, end='') 


£.close() 


例 7-4 移动 文件 指针 。 

Python 2.x 和 Python 3.x 对 于 seek() 方 法 的 理解 和 处 理 是 一 致 的 ,即将 文件 指针 定 
位 到 文件 中 指定 字 节 的 位 置 。 但 是 由 于 对 中 文 的 支持 程度 不 一 样 , 可 能 会 导致 在 Python 
2. x 和 Python 3.x 中 的 运行 结果 有 所 不 同 。 例 如 ,下 面 的 代码 在 Python 3. 5. 1 中 运行 , 当 
遇 到 无 法 解码 的 字符 会 抛 出 异常 。 


>>> s= ' 中 国 山 东 烟 台 SDIBT' 

>>> fp=open(r'D:\sample.txt', 'w') 
>>> fp.write (s) 

>>> fp.close () 

>>> fp=open(r'D:\sample.txt', 'r') 
>>> print (fp.read (3) ) 

中 国 山 

>>> fp.seek (2) 

2 

>>> print (fp.read (1)) 

>>> fp.seek (13) 

a3 

>>> print (fp.read (1)) 

D 

>>> fp.seek (15) 

15 

>>> print (fp.read (1)) 

B 

>>> fp.seek (3) 

3 

>>> print (fp.read (1)) 
UnicodeDecodeError: ' gbk ' codec can ' t decode byte Oxfa in position 0: illegal 
multibyte sequence 


而 在 Python 2.7. 11 中 , 则 不 抛 出 异常 ,而 是 输出 乱码 ,例如 下 面 的 代码 : 
>>> s= ' 中 国 山 东 烟 台 SDIBT' 
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>>> fp=open(r'D:\sample.txt', 'w') 
>>> fp.write(s) 

>>> fp.close() 

>>> fp=open(r'D:\sample.txt', 'r') 
>>> print (fp.read (3) ) 

On 

>>> fp.seek (2) 

>>> print (fp.read (3) ) 

aE 

>>> print (fp.read (2)) 


R 


例 7-5 读 取 文本 文件 data. txt 中 所 有 整数 ,将 其 按 升序 排序 后 再 写 入 文本 文件 


data_asc. txt 中 。 


with open('data.txt', 'r') as fp: 
data= fp.readlines () 
data= [int (line.strip()) for line in data] 
data.sort () 
data= [str (i)+ '\n' for i in data] 
with open('data_asc.txt', 'w') as fp: 
fp.writelines (data) 


PI 7-6 编写 程序 ,保存 为 demo6. py, 运 行 后 生成 文件 demo6_new. py, 其 中 的 内 容 与 


demo6, py 一 致 ,但 是 在 每 行 的 行 尾 加 上 了 行 号 。 
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filename= 'demo6.py' 
with open (filename, 'r') as fp: 


lines= fp. readlines () 


lines= [line. rstrip()+' '* (100- len (line)) + '#'+ str (index) + '\n' for index, line in 


enumerate (lines) ] 
with open (filename[:-3]+' new.py', 'w') as fp: 


fp.writelines (lines) 
例 7-7 Python 程序 中 代码 复 用 度 检测 。 


from os.path import isfile as isfile 


from time import time as time 


Result= {} 

AllLines= [] 

FileName= r'FindLongestReuse.py" 

#FileName= input ("Please input the file to check, including full path: ') 


#Read the content of given file 
#Remove blank lines 

#Remove all the whitespace string of every line, 

#preserving only one space character between words or operators 


#note:The last line does not contain the '\n' character 
def PreOperate(): 
global AllLines 
with open (FileName, 'r') as fp: 
for line in fp: 


line=' '.join(line.split ()) 


if line != 


AllLines.append (line) 


#Check if the current position is still the duplicated one 
def IfHasDuplicated (Index1) : 
for item in Result .values (): 
for it in item: 
if Indexl= 


it[0]: 
return it[1] #return the span 


return False 


#I£ the current line Index2 is in a span of duplicated lines, return True, else False 
def IsInSpan (Index2) : 
for item in Result.values(): 
for i in item: 
if i[0]<=Index2<i[0]+i[1]: 
return True 


return False 


def MainCheck (): 
global Result 
TotalLen= len (AllLines) 
Index1=0 
while Indexl< TotalLen- 1: 
#speed up 
span= IfHasDuplicated (Index1) 
if span: 
Index1+= span 
continue 
Index2= Index1+ 1 
while Index2< TotalLen: 
#speed up, skip the duplicated lines 
if IsInSpan (Index2) : 
Index2+=1 
continue 
src="" 
es 
for i in range (10) : 


if Index2+ i>=TotalLen: 


163}—______ 


164 


break 
src+=AllLines [Indexl+ i] 
dest =AllLines [Index2+ i] 
if src==des: 
t=Result .get (Indexl, []) 
for tt int: 
if tt [0]==Index2: 
tt[1]=i+1 
break 
else: 
t.append ([Index2, i+1]) 
Result [Index1]=t 
else: 
break 
t=Result.get (Indexl, []) 
for tt int: 
if tt[0 
Index2+=tt[1] 
break 


else: 
Index2+=1 


#Optimize the Result dictionary, remove the items with span< 3 
Result [Index1]=Result.get (Indexl, []) 
for n in Result [Index1] [::- 1]: #Note: here must use the reverse slice, 
if n[1]<3: 
Result [Index1] . remove (n) 
if not Result [Index1]: 
del Result [Index1] 


#Compute the min span of duplicated codes of line Indexl,modify the step 
#Index1 
a= [ttt[1] for ttt in Result.get (Index1, [[Index1, 1]])] 
ifa: 
Indexl+=max (a) 
else: 


Indexl+=1 


#Output the result 
def Output () : 
print ('-' * 20) 
print ('-' * 20) 


print (*Result:' 
for key, value in Result.items(): 
print ("The original line is: \n {0}".format (AllLines[key])) 
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print ("Its line number is {0}'.format (key) ) 
print ("The duplicated line numbers are:') 
for i in value: 
print (* Start:', i[0], ' Span:', i[1]) 
print ('- ' * 20) 
print ('-' * 20) 


if isfile (FileName): 
start=time () 
PreOperate () 
MainCheck () 
Output () 
print ('Time used:', time()- start) 


7.3 ”二进制 文件 操作 案例 精 选 


数据 库 文件 .图 像 文 件 、 可 执行 文件 、 音 视频 文件 ,Office 文档 等 均 属 于 二 进 制 文件 。 二 
进 制 文件 不 能 使 用 记事 本 或 其 他 文本 编辑 软件 正常 读 写 ,也 无 法 通过 Python 的 文件 对 象 
直接 读 取 和 理解 二 进 制 文件 的 内 容 。 必 须 正确 理解 二 进 制 文件 结构 和 序列 化 规则 ,才能 准 
确 地 理解 其 中 内 容 并 且 设 计 正 确 的 反 序列 化 规则 。 所 谓 序列 化 ,简单 地 说 就 是 把 内 存 中 的 
数据 在 不 丢失 其 类 型 信息 的 情况 下 转 成 对 象 的 二 进 制 形式 的 过 程 ,对 象 序列 化 后 的 形式 经 
过 正确 的 反 序列 化 过 程 应 该 能 够 准确 无 误 地 恢复 为 原来 的 对 象 。 

Python 中 常用 的 序列 化 模块 有 struct, pickle,json,marshal 和 shelve。 本 节 主 要 介绍 
struct 和 pickle 模块 在 对 象 序列 化 和 二 进 制 文件 操作 方面 的 应 用 ,其 他 模块 请 参考 有 关 
文档 。 


7.3.1 使 用 pickle 模块 


pickle 是 较为 常用 并 且 速 度 非常 快 的 二 进 制 文件 序列 化 模块 ,下 面 通过 两 个 示例 来 了 
解 一 下 如 何 使 用 pickle 模块 进行 对 象 序列 化 和 二 进 制 文件 读 写 。 
例 7-8 使 用 pickle 模块 写 人 二 进 制 文件 。 


import pickle 


f=open ("sample _pickle.dat', 'wb') 
n=7 

i= 13000000 

a= 99.056 

s= "中 国人 民 123abc" 

lst= [[1, 2, 3], [4, 5, 6], [7, 8, 9]] 
tu= (-5, 10, 8) 

coll={4, 5, 6} 


dic={'a':'apple', 'b':'banana', 'g':'grape', 'o':‘orange"} 
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try: 
pickle.dump(n, f) 
pickle.dump(i, f) 
pickle.dump(a, f) 
pickle.dump(s, f) 
pickle.dump (lst, f) 
pickle.dump (tu, f) 
pickle.dump (coll, f) 
pickle.dump (dic, f) 

except: 
print (' 写 文件 异常 ') 

finally: 


f.close () 
例 7-9 读 取 例 7-8 中 写 入 二进制 文件 的 内 容 。 


import pickle 


f=open('sample_pickle.dat', 'rb') 
n= pickle. load (f) # 读 出 文件 的 数据 个 数 
i=0 
while i<n: 
x=pickle. load (f) 
print (x) 
i=itl 


f£.close() 


7.3.2 使 用 struct 模块 


struct 也 是 比较 常用 的 对 象 序列 化 和 二 进 制 文件 读 写 模 块 ,下 面 通过 两 个 示例 来 简单 
介绍 使 用 struct 模块 对 二 进 制 文件 进行 读 写 的 用 法 。 
例 7-10 使 用 struct 模块 写 人 二 进 制 文件 。 


import struct 


n= 1300000000 

x= 96.45 

b= True 

s='al@ 中 国 ' 

sn=struct.pack('if? ', n, x, b) 
f=open('sample struct.dat', 'wb') 
f.write(sn) 

f.write (s.encode () ) 

f.close() 


例 7-11 使 用 struct 模块 读 取 例 7-10 写 入 二进制 文件 的 内 容 。 
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import struct 


f=open('sample_struct.dat', 
sn=f.read (9) 
tu=struct.unpack('if? ', sn 
print (tu) 

n, x, bl=tu 

print ('n=',n, 'x=',x, 'bl=' 
s=f.read(9) 

s= s.decode () 


print ('s=', s) 


文件 操作 


'rb') 


) 


bl) 


7.4 文件 级 操作 


如 果 仅 需要 对 文件 内 容 进行 读 写 ,可 以 使 用 7. 1 节 中 介绍 的 文件 对 象 ;如 果 需 要 处 理 文 


件 路 径 , 可 以 使 用 os. path 模块 


中 的 对 象 和 方法 ;如 果 需 要 使 用 命令 行 读 取 文 件 内 容 可 以 使 


用 fileinput 模块 ;创建 临时 文件 和 文件 夹 可 以 使 用 tempfile 模块 ;另外 ,pathlib 模块 提供 了 
大 量 用 于 表示 和 处 理 文件 系统 路 径 的 类 。 


7.4.1 os 5 os. path 模块 


os 模块 除了 提供 使 用 操作 
件 级 操作 的 方法 ,如 表 7-4 所 示 
件 夹 遍历 的 方法 ,如 表 7-5 所 示 


方 ”法 


系统 功能 和 访问 文件 系统 的 简便 方法 之 外 ,还 提供 了 大 量 文 
o os. path 模块 提供 了 大 量 用 于 路 径 判断 、 切 分 ,连接 以 及 文 


表 7-4 os 模块 常用 文件 操作 方法 
功能 说 明 


access(path, mode) 


按照 mode 指定 的 权限 访问 文件 


open(path, flags, mode=00777, * , 
dir_fd= None) 


按照 mode 指定 的 权限 打开 文件 ,默认 权限 为 可 读 、 可 写 、 可 执行 


chmod(path, mode, * ,dir_fd 一 


None, follow_symlinks= True) EI 

remove(path) 删除 指定 的 文件 

reneme(sresdst) 重 命名 文件 或 目录 

stat(path) 返回 文件 的 所 有 属性 

fstat(path) 返回 打开 的 文件 的 所 有 属性 
listdirCpath) 返回 path 目录 下 的 文件 和 目录 列表 
startfile(filepath [ ,operation]) 使 用 关联 的 应 用 程序 打开 指定 文件 
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表 7-5 os. path 模块 常用 文件 操作 方法 
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方 法 功能 说 明 
abspath( path) 返回 绝对 路 径 
dirname(p) 返回 目录 的 路 径 
exists(path) 判断 文件 是 否 存在 
getatime( filename) 返回 文件 的 最 后 访问 时 间 
getctime(filename) 返回 文件 的 创建 时 间 
getmtime(filename) 返回 文件 的 最 后 修改 时 间 
getsize( filename) 返回 文件 的 大 小 
isabs(path) 判断 path 是 否 为 绝对 路 径 
isdir( path) 判断 path 是 否 为 目录 
isfile( path) 判断 path 是 否 为 文件 
join(path, * paths) 连接 两 个 或 多 个 path 
split(path) 对 路 径 进行 分 割 , 以 元 组 形式 返回 
splitext(path) 从 路 径 中 分 割 文件 的 扩展 名 
splitdrive( path) 从 路 径 中 分 割 驱动 器 的 名 称 


下 面 通过 几 个 示例 来 演示 os 和 os. path 模块 的 用 法 。 


>>> import os 
>>> import os.path 
>>> os.path.exists('test1l.txt') 
False 
>>> os.rename ('C:\\test1.txt', 'p:\\test2.txt") 
HERH 'C:\\test1.txt' 不 存在 ,出 错 信息 
>>> os.rename ('C:\\dfg.txt', 'D:\\test2.txt') 
#os.rename () 可 以 实现 文件 的 改名 和 移动 
>>> os.path.exists ('C:\\dfg.txt") 
False 
>>> os.path.exists ('D:\\dfg.txt") 
False 
>>> os.path.exists ('D:\\test2.txt") 
True 
>>> path= 'D:\\mypython_exp\\new_test.txt" 
>>> os .path.dirname (path) 
*D:\\mypython_exp' 
>>> os.path. split (path) 
("D:\\mypython_exp', 'new_test.txt') 
>>> os.path.splitdrive (path) 


EE wt 


('D:', '\\mypython exp\\new test.txt') 

>>> os.path.splitext (path) 

("D:\\mypython_exp\\new test', '.txt") 

下 面 的 代码 可 以 列 出 当前 目录 下 所 有 扩展 名 为 pye 的 文件 ,其 中 用 到 了 列表 推导 式 ,可 
以 查阅 前 面 的 2. 1. 9 节 了 解 相关 知识 。 


>>> import os 
>>> print ( [fname for fname in os.listdir (os.getcwd ()) if os.path.isfile (fname) and fname. 


endswith('.pyc")]) 

['consts.pyc', 'database_demo.pyc', 'nqueens.pyc"] 

下 面 的 代码 用 来 将 当前 目录 的 所 有 扩展 名 为 html 的 文件 重 命名 为 扩展 名 为 htm 的 
SOF. 


import os 


file _list=os.listdir(".") 
for filename in file list: 
pos= filename. rindex(".") 
if filename [post 1:]=="html": 
newname= filename[:pos+1]+ "htm" 
os.rename (filename, newname) 


print (filename+ "更 名 为 : "+newname) 
当然 ,也 可 以 改写 为 下 面 的 简洁 而 等 价 的 代码 : 
import os 


file _list= [filename for filename in os.listdir(".") if filename.endswith 
('.html')] 
for filename in file list: 

newname= filename[:- 4]+ 'htm' 

os.rename (filename, newname) 


print (filename+ "更 名 为 : "+newname) 


7.4.2 shutil 模块 


shutil 模块 也 提供 了 大 量 的 方法 支持 文件 和 文件 夹 操作 ,详细 的 方法 列表 可 以 使 
(Cshutil) 查 看 。 


H dir 


>>> import shutil 
>>> dir (shutil) 


例如 ,下 面 的 代码 使 用 该 模块 的 copyfile() 方 法 复制 文件 。 


>>> import shutil 
>>> shutil.copyfile('C:\\dir.txt', 'C:\\dirl.txt') 
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下 面 的 代码 将 C:\Python34\Dlls 文件 夹 以 及 该 文件 夹 中 所 有 文件 压缩 至 D:\a. zip 
交 件 。 


>>> shutil.make archive('D:\\a', 'zip', 'C:\\Python34', 'Dlls') 
"D:\\a.zip" 


而 下 面 的 代码 则 将 刚 压缩 得 到 的 文件 D:\a. zip 解压 缩 至 D:\a_unpack 文件 夹 。 
>>> shutil.unpack archive('D:\\a.zip', 'D:\\a_unpack') 
下 面 的 代码 使 用 shutil 模块 的 方法 删除 刚刚 解压 缩 得 到 的 文件 夹 。 


>>> shutil.rmtree('D:\\a_unpack') 


7.5 目录 操作 


除了 支持 文件 操作 ,os 和 os. path 模块 还 提供 了 大 量 的 目录 操作 方法 ,os 模块 常用 目 
录 操 作 方 法 与 成 员 如 表 7-6 所 示 ,可 以 通过 dir(os. path) 查 看 os. path 模块 更 多 关于 目录 操 
作 的 方法 。 
表 7-6 os 模块 常用 目录 操作 方法 与 成 员 


方 法 功能 说 明 
mkdir(path[ ,mode=0777]) 创建 目录 
makedirs(pathl/path2*… ,mode=511) 创建 多 级 目录 
rmdir(path) 删除 目录 
removedirs(pathl/path2…) 删除 多 级 目录 
listdir(path) 返回 指定 目录 下 的 文件 和 目录 信息 
getcwd() 返回 当前 工作 目录 
get_exec_path() 返回 可 执行 文件 的 搜索 路 径 
chdir(path) 把 path 设 为 当前 工作 目录 
walk(top, topdown= True, onerror= None) sel ENE EER tt e 
路 径 名 、 所 有 目录 列表 与 文件 列表 
sep 当前 操作 系统 所 使 用 的 路 径 分 隔 符 
extsep 当前 操作 系统 所 使 用 的 文件 扩展 名 分 隔 符 


下 面 的 代码 演示 了 如 何 使 用 os 模块 的 方法 来 查看 改变 当前 工作 目录 ,以 及 创建 与 删 
除 目录 。 
>>> import os 


>>> os.getcwd () # 返 回 当前 工作 目录 
>>> os.mkdir (os.getcwd()+ '\\temp') # 创 建 目录 
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>>> os.chdir (os.getcwd()+ '\\temp') # 改 变 当前 工作 目录 
>>> os .getowd () 


>>> os.mkdir (os .getcwd()+ "\\test') 
>>> os.listdir('.") 
>>> os.mmdir ("test") # 删 除 目 录 


如 果 需 要 遍历 指定 目录 下 所 有 子 目 录 和 文件 ,可 以 使 用 递归 的 方法 ,例如 : 


import os 


def visitDir (path) : 

if not os.path.isdir (path) : 
print ('Error:', path,' is not a directory or does not exist.') 
return 

for lists in os.listdir (path): 
sub_path=os.path.join (path, lists) 
print (sub_path) 
if os.path.isdir(sub_path): 

visitDir (sub path) 


visitDir('E:\\test') 
下 面 的 代码 则 使 用 os 模块 的 walk() 方 法 指定 目录 的 遍历 。 


import os 


def visitDir2 (path) : 

if not os.path.isdir (path) : 
print ('"Error:', path,' is not a directory or does not exist.') 
return 

list_dirs=os.walk (path) 

for root, dirs, files in list_dirs: HÈ ATCA BRAC. 
for d in dirs: 

print (os.path.join (root, d)) # 获 取 完 整 路 径 

for f in files: 


print (os.path.join (root, f)) # 获 取 文件 绝对 路 径 


visitDir2('h:\\music') 


7.6 案例 精 选 
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例 7-12 计算 CRC32 值 。 下 面 的 代码 分 别 使 用 zlib 和 binascii 模块 的 方法 来 计算 任 


意 字符 串 的 CRC32 值 ,该 代码 经 过 简单 修改 , 即 可 用 来 计算 文件 的 CRC32 值 。 


>>> import zlib 
>>> print (zlib.crc32 ('1234' .encode () ) ) 
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2165402659 
>>> print (zlib.crc32('111'.encode ())) 
1298878781 

>>> print (zlib.crc32 ('SDIBT' .encode ())) 
2095416137 


>>> import binascii 
>>> binascii.crce32 ('SDIBT' .encode ()) 
2095416137 


例 7-13 计算 文本 文件 中 最 长 行 的 长 度 。 
方法 一 : 


f=open('D:\\test.txt', 'r') 

allLineLens= [len(line.strip()) for line in f] 
f£.close() 

longest=max (allLineLens) 

print (longest) 


方法 二 : 


f=open('D:\\test.txt', 'r') 
longest=max(len(line.strip()) for line in f) 
£.close() 


print (longest) 


Bl 7-14 计算 字符 串 MDS 值 。MD5 值 可 以 用 来 判断 文件 发 布 之 后 是 否 被 自 改 ,对 于 
完整 性 保护 具有 重要 意义 。 


>>> import hashlib 

>>> import md5 

>>> md5value=hashlib.md5() 

>>> mdSvalue.update ('12345' .encode () ) 
>>> mdSvalue=md5value.hexdigest () 
>>> print (mdSvalue) 
827ccb0eea8a706c4c34al6891f84e7b 

>>> md5value=md5.md5() 

>>> md5value .update ('12345' .encode () ) 
>>> mdSvalue=md5value.hexdigest () 
>>> print (md5value) 
827ccb0eea8a706c4c34al6891£84e7b 


对 上 面 的 代码 稍 加 完善 , 即 可 实现 自己 的 MD5 计算 器 ,例如 : 


import hashlib 
import os 
import sys 


fileName= sys.argv[1] 
if os.path.isfile (fileName) : 


with open (fileName, 'r') as fp: 
lines= fp.readlines () 


data= ''.join (lines) «encode () 
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print (hashlib.md5 (data) .hexdigest()) 


将 上 面 的 代码 保存 为 文件 Check MDSOFFile. py, 然 后 计算 指定 文件 的 MD5 值 , 对 该 文 


件 做 微小 修改 后 再 次 计算 其 MD5 值 。 
化 也 是 非常 大 的 ,如 图 7-1 所 示 。 


可 以 发 现 ,哪怕 只 是 修改 了 一 点 点 内 容 ,MD5 值 的 变 


BS" 


llo world 


:\Python35> 


:\Python35>echo hello world > test.txt 
2\Python35>type test .txt 

:\Python35>python CheckMDSOfFile.py test .txt 
df02967h5ae298861db1f1ad2a6b6b4 
:\Python35Yecho hello worldi > test.txt 


=\Python35>python CheckMDSOfFile.py test .txt 
db543egBcf5585aa6d7242Bcfe2e95 


图 7-1 计算 文件 MD5 值 


另外 ,也 可 以 使 用 ssdeep 工具 来 计算 文件 的 模糊 哈 希 值 或 分 段 喻 希 值 ,或 者 编写 
Python 程序 调用 ssdeep 提供 的 APT 函数 来 计算 文件 的 模糊 哈 希 值 ,模糊 哈 希 值 可 以 用 来 


比较 两 个 文件 的 相似 百分比 。 


>>> from ssdeep import ssdeep 
>>> s= ssdeep () 
>>> print s.hash file (filename) 


对 于 某 些 恶意 软件 来 说 ,可 能 会 对 自身 进行 加 这 或 加 密 ,真正 运行 时 再 脱 过 或 解密 ,这 
样 一 来 ,会 使 得 磁盘 文件 的 哈 希 值 和 内 存 中 脱 壳 或 解密 后 进程 的 哈 希 值 相 差 很 大 。 因 此 , 根 
据 磁盘 文件 和 其 相应 的 进程 之 间 模 糊 哈 希 值 的 相似 度 可 以 判断 该 文件 是 否 包含 自 修改 代 
码 ,并 以 此 来 判断 其 为 恶意 软件 的 可 能 性 。 

例 7-15 判断 一 个 文件 是 否 为 GIF 图 像 文件 。 任 何 一 种 文件 都 具有 专门 的 文件 头 结 
构 ,在 文件 头 中 存放 了 大 量 的 信息 ,其 中 就 包括 该 文件 的 类 型 。 通 过 文件 头 信息 来 判断 文件 
类 型 的 方法 可 以 得 到 更 加 准确 的 信息 ,而 不 依赖 于 文件 扩展 名 。 


>>> def is gif (fname) : 
f=open (fname, 'r') 
first4=tuple (f.read (4)) 
f.close() 
return first4==('G', 'I', 'E', 

>>> is_gif('c:\\test.gif') 

True 

>>> is gif ('C:\\dir.txt') 


False 
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例 7-16 比较 两 个 文本 文件 是 否 相 同 。 这 里 使 用 到 了 difflib 模块 的 SequenceMatcher() 
方法 ,检测 结果 相对 还 算 清晰 ,请 大 家 运行 下 面 的 代码 并 查看 结果 。 


import difflib 
A=open('c:\\dir.txt', 'r') 
B=open('C:\\dirl.txt', 'r') 
contextA=A.read() 
contextB=B. read () 
s=difflib.SequenceMatcher (lambda x: x=="", contextA, contextB) 
result=s.get_opcodes () 
for tag, il, i2, jl, j2 in result: 
print ("%s contextA[%d:%d]=%s contextB[%d:%d]=%s"8\ 
(tag, il, i2, contextA [il:i2], jl, j2, contextB[j1:j2])) 


例 7-17 使 用 xlwt BERG A Excel 文件 。xlwt 模块 默认 没有 安装 ,可 以 使 用 pip 来 
安装 。 


from xlwt import * 


book= Workbook () 

sheet 1=book.add_sheet ("First") 

al=Alignment () 

al.horz=Alignment .HORZ_CENTER # 对 齐 方式 
al.vert=Alignment .VERT_CENTER 

borders= Borders () 

borders .bottom= Borders. THICK # 边 框 样式 
style=XFStyle () 

style.alignment=al 

style.borders=borders 

row0= sheet1. row (0) 

IOow0 .write (0, 'test', style=style) 


book.save (r'D:\test.xls') 
例 7-18 使 用 xlrd 模块 读 取 Excel 文件 ,xlrd 模块 需要 单独 安装 。 


>>> import xlrd 

>>> book=xlrd.open_workbook (r'D:\test .x1s") 
>>> sheet1=book.sheet_by name('First') 

>>> row0= sheet1.row (0) 

>>> print (row0[0]) 

text:u'test' 

>>> print (row0 [0] .value) 

test 


例 7-19 使 用 Pywin32 操作 Excel 文件 。Pywin32 模块 需要 单独 安装 ,这 是 一 个 功能 


非常 强大 的 模块 ,提供 了 Windows 底层 API 函数 的 封装 ,使 得 可 以 在 Python 中 直接 调用 
Windows API 函数 ,支持 大 量 的 Windows 底层 操作 。 
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xlApp=win32com.client.Dispatch ("Excel Application") HIF Excel 
x1Book= x1App .Workbooks .Open ('D:\\1.x1s') 

x1Sht= x1Book.Worksheets ("sheet 1") 

aaa=x1Sht.Cells(1, 2) .Value 

xlSht.Cells (2, 3) .Value=aaa 

x1Book.Close (SaveChanges= 1) 

del xlApp 


例 7-20 检查 Word 文档 的 连续 重复 字 。 在 Word 文档 中 ,经 常会 由 于 键盘 操作 不 小 


心 而 使 得 文档 中 出 现 连 续 的 重复 字 , 例 如 * 用 户 的 的 资料 ?或 “需要 需要 用 户 输入 "之 类 的 情 
况 。 下 面 的 代码 使 用 Pywin32 模块 中 的 win32com 对 Word 文档 进行 检查 并 提示 类 似 的 重 
复 汉字 或 标点 符号 。 


import sys 
from win32com import client 


filename=r'c:\test.doc' 
word=client.Dispatch ('Word.Application') 
doc= word.Documents .Open (filename) 
content= str (doc.Content) 

doc.Close () 

word.Quit () 


repeatedWords= [] 


lens= len (content) 
for i in range(lens- 2): 
ch= content [i] 
chl=content [i+ 1] 
ch2=content [i+ 2] 
if (u'\u4e00'<=ch< =u'\u9fa5" E dhin ("s hs 
if ch==ch1 and ch+ chl not in repeatedWords: 
print (ch+ ch1) 
repeatedWords .append (ch+ ch1) 
elif ch==ch2 and ch+chl+ch2 not in repeatedWords: 
print (cht chl+ ch2) 
repeatedWords .append (ch+ chl+ ch2) 


例 7-21 编写 程序 ,进行 文件 夹 增 量 备份 。 
程序 功能 与 用 法 : 指定 源 文 件 夹 与 目标 文件 夹 , 自 动 检测 自 上 次 备份 以 来 源 文件 夹 中 


内 容 的 改变 ,包括 修改 的 文件 新 建 的 文件 .新 建 的 文件 夹 等 ,自动 复制 新 增 或 修改 过 的 文件 
到 目标 文件 夹 中 , 自 上 次 备份 以 来 没有 修改 过 的 文件 将 被 忽略 而 不 复制 ,从 而 实现 增 量 备 
份 。 本 例 内 容 属 于 系统 自动 运 维 的 范畴 ,更 多 关于 系统 运 维 的 知识 请 参考 12. 6 节 。 


import os 
import filecmp 
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import shutil 
import sys 


def autoBackup(scrDir, dstDir): 
if ((not os.path.isdir(scrDir)) or (not os.path.isdir (dstDir)) or 
(os.path.abspath (scrDir)! =scrDir) or (os.path.abspath (dstDir) !=dstDir)): 
usage () 
for item in 0s.listdir(scrDir) : 
scrItem=os.path.join(scrDir, item) 
dstItem= scrItem.replace (scrDir,dstDir) 
if os.path.isdir(scrItem) : 
# 创建 新 增 的 文件 夹 ,保证 目标 文件 夹 的 结构 与 原始 文件 夹 一 至 
if not os.path.exists (dstItem) : 
os.makedirs (dstItem) 
print ("make directory'+ dstItem) 
autoBackup(scrItem, dstItem) 
elif os.path.isfile(scrItem) : 
# 只 复制 新 增 或 修改 过 的 文件 
if ((not os.path.exists (dstItem)) or 
(not filecmp.cmp (scrItem，dstItem，shallow=False))) : 
shutil.copyfile(scrItem, dstItem) 
print ('file:'+scrItem+ '==>'+dstItem) 


def usage(): 
print ('scrDir and dstDir must be existing absolute path of certain directory") 
print ('For example: {0} c:\\olddir c:\\newdir'. format (sys.argv[0])) 
sys.exit (0) 


if name =='_main_': 


if len(sys.argv) !=3: 

usage () 
scrDir, dstDir=sys.argv[1], sys.argv[2] 
autoBackup (scrDir, dstDir) 


例 7-22 编写 程序 ,统计 指定 文件 夹 大 小 以 及 文件 和 子 文件 夹 数量 。 
本 例 代码 也 属于 系统 运 维 范畴 ,可 用 于 磁盘 配额 的 计算 。 


import os 


totalSize=0 
fileNum= 0 
dirNum=0 


def visitDir (path) : 
global totalSize 
global fileNum 


global dirNum 

for lists in os.listdir (path): 
sub_path=os.path. join (path, lists) 
if os.path.isfile (sub path): 


fileNum= fileNumt 1 # 统 计 文件 数量 
totalSize=totalSize+os.path.getsize (sub path) ## 统 计 文件 总 大 小 
elif os.path.isdir(sub path): 
dirNum=dirNumt 1 # 统 计 文 件 夹 数量 
visitDir(sub_path) # 递 归 遍 历 子 文件 夹 
def main (path) : 


if not os.path.isdir (path) : 
print ('Error:"', path, '" is not a directory or does not exist.') 
return 


visitDir (path) 


def sizeConvert (size): # 单 位 换算 


K, M, G=1024, 1024* * 2, 1024* * 3 
if size >=G: 

return str(size/G)+ 'G Bytes" 
elif size >=M: 

return str(size/M)+ 'M Bytes' 
elif size >=K: 

return str(size/K)+ 'K Bytes' 
else: 


return str(size)+ 'Bytes' 


def output (path) : 


print ("The total size of '+path+' is:'+sizeConvert (totalSize)+'('+str(totalSize)+' 
Bytes) ') 

print ('The total number of files in '+path+' is:',fileNum) 

print ('The total number of directories in '+path+' is:',dirNum) 

' main ': 

path= r'd:\idapro6.5plus' 

main (path) 

output (path) 


例 7-23 编写 程序 ,统计 指定 目录 所 有 C++ 源 程序 文件 中 不 重复 代码 行 数 。 
本 例 只 考虑 C++ 源 程序 文件 (扩展 名 为 cpp) ,并 且 只 认为 严格 相等 的 两 行为 重复 行 。 


from os.path import isdir, join 


from os import listdir 


AllLines= [] # 保 存 所 有 代码 行 
NotRepeatedLines= [] ## 保 存 非 重复 的 代码 行 


mi 
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file nm=0 # 文 件数 量 
code_num=0 # 代 码 总 行 数 


def LinesCount (directory) : 
global AllLines 
global NotRepeatedLines 
global file nm 
global code_num 


for filename in listdir (directory): 
temp= join (directory, filename) 


if isdir (temp) : # 递 归 遍 有 历 子 文件 夹 
LinesCount (temp) 
elif temp.endswith(".cpp'): # GB .cpp 文件 


file nm +=1 
with open (temp, 'r') as fp: 
while True: 
line= fp.readline () 


if not line: 


break 
if line not in NotRepeatedLines: 

NotRepeatedLines.append (line) # 记 录 非 重复 行 
code num +=1 # 记 录 所 有 代码 行 


return (code_num, len (NotRepeatedLines) ) 
path= r'C:\Users\Dong\Desktop\VC+ + 6.0" 
print ("代码 总 行 数 : {0[0]}, 非 重复 代码 行 数 : {0[1]}' . format (LinesCount (path) ) ) 
print (' 文 件数 量 : {0}' .format (file num)) 


例 7-24 编写 程序 ,递归 删除 指定 文件 夹 中 指定 类 型 的 文件 。 
本 例 代码 也 属于 系统 运 维 范畴 ,可 用 于 清理 系统 中 的 临时 垃圾 文件 或 其 他 指定 类 型 的 
文件 , 稍 加 扩展 还 可 以 删除 大 小 为 0 字 节 的 文件 。 


from os.path import isdir, join, splitext 
from os import remove, listdir 


import sys 
filetypes=['.tmp', '.log', '.obj', '.txt'] # 指 定 要 删除 的 文件 类 型 


def delCertainFiles (directory) : 
if not isdir (directory) : 
return 
for filename in listdir (directory): 
temp=join (directory, filename) 
if isdir (temp): 
delCertainFiles (temp) 
elif splitext (temp) [1] in filetypes: # 检 查 文件 类 型 
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st 


remove (temp) 
print (temp, ' deleted.-+") 


def main(): 
directory=r'E:\new' 
#directory=sys.argv[1] 
delCertainFiles (directory) 


main () 


如 果 文 件 夹 中 有 带 特殊 属性 的 文件 或 子 文件 夹 ,上 面 的 代码 可 能 会 无 法 删除 带 特殊 属 
性 的 文件 ,利用 Python 扩展 库 pywin32 可 以 解决 这 一 问题 。 


import win32con 

import win32api 

import os 

From win32con import FILE_ATTRIBUTE_NORMAL 


def del dir (path): 
for file in os.listdir (path) : 
file_or_dir=os.path.join (path, file) 
if os.path.isdir (file or dir) and not os.path.islink(file_or_dir): 


del_dir(file_or dir) # 递 归 删 除 子 文件 夹 及 其 文件 
else: 

try: 
os.remove (file or dir) 尝试 删除 该 文件 

except: # 无 法 删除 ,很 可 能 是 文件 拥有 特殊 属性 
win32api .SetFileAttributes (file or dir, FILE ATTRIBUTE NORMAL) 
os.remove (file or dir) # 修 改 文件 属性 ,设置 为 普通 文件 ,再 次 删除 

os.mmdir (path) # delete the directory here 


del_dir("E:\\old") 
例 7-25 使 用 扩展 库 openpyxl 读 写 Excel 2007 及 更 高 版 本 的 Excel 文件 。 


import openpyxl 
from openpyxl import Workbook 


fn=r'f:\test.xlsx' # 文 件 名 

wb=Workbook () URTHE 
ws=wb.create_sheet (title= ' 你 好 ,世界 ') # 创 建 工 作 表 

ws["'A1']=' 这 是 第 一 个 单元 格 ' # 单 元 格 赋值 
ws['B1']=3.1415926 

wb.save (fn) # 保 存 Excel 文件 
wb=openpyx1.1load_workbook (fn) # 打 开 已 有 的 Excel 文件 
ws=wb.worksheets [1] # 打 开 指 定 索引 的 工作 表 
print (ws ['A1'] .value) # 读 取 并 输出 指定 单元 格 的 值 
ws.append ([1,2, 3,4,5]) # 添 加 一 行 数据 
ws.merge cells ('F2:F3') # 合 并 单元 格 
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ws ['F2"]="=sum(A2:E2)" 


for r in range (10,15): 


for c in range (3,8): 


_=ws.cell (row=r, column=c, value=r* c) 


wb. save (fn) 


假设 某 学校 所 有 课程 每 学 期 允许 多 次 考试 ,学 生 可 随时 参加 考试 ,系统 自动 将 每 次 成 绩 
添加 到 Excel 文件 (包含 3 列 : 姓名 、 课 程 、 成 绩 ) 中 , 现 期 末 要 求 统计 所 有 学 生 每 门 课程 的 


# 写 和 人 公式 


# 写 人 单元 格 数据 


最 高 成 绩 。 下 面 的 代码 首先 模拟 生成 随机 成 绩 数据 ,然后 进行 统计 分 析 o 
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import openpyx1 
from openpyx1 import Workbook 
import random 


# 生 成 随机 数据 


def generateRandomInformation (filename) : 


workbook= Workbook () 
worksheet= workbook.worksheets [0] 
worksheet .append ([' 姓 名 ', ' 课 程 ', ' 成 绩 ']) 
# 中 文 名 字 中 的 第 一 、 第 二 ,第 三 个 字 
first=tuple(' 赵 钱 孙 李 ') 
middle= tuple ("fil FRA ') 
last=tuple ("Hh #4i& ') 
# 课 程 名 称 
subjects= (' 语 文 ', ' 数 学 ', ' 英 语 ') 
# 随 机 生成 200 个 数据 
for i in range (200): 
line= [] 
r= random. randint (1,100) 
name= random.choice (first) 
# 按 一 定 概率 生成 只 有 两 个 字 的 中 文 名 字 
if r>50: 
name= name + random.choice (middle) 
name=name + random.choice (last) 
# 依 次 生成 姓名 、 课 程 名 称 和 成 绩 
line.append (name) 
line.append (random.choice (subjects) ) 
line .append (random. randint (0, 100) ) 
worksheet .append (line) 
# 保 存 数据 ,生成 Excel 2007 格 式 的 文件 


workbook. save (filename) 


def getResult (oldfile, newfile) : 


# 用 于 存放 结果 数据 的 字典 
result=dict () 


# 打 开 原始 数据 


workbook= openpyx1.load workbook (oldfile) 
worksheet= workbook.worksheets[0] 
# 遍 历 原 始 数据 
for row in worksheet .rows[1:]: 
# 姓 名 ,课程 名 称 , 本 次 成 绩 
name, subject, grade=row[0].value, row[1].value, row[2].value 
# 获 取 当 前 姓名 对 应 的 课程 名 称 和 成 绩 信息 
# 如 果 result 字 典 中 不 包含 , 则 返回 空 字典 
t=result.get (name, {}) 
# 获 取 当 前 学 生 当 前 课程 的 成 绩 , 若 不 存在 ,返回 0 
f=t.get (subject, 0) 
# 只 保留 该 学 生 该 课程 的 最 高 成 绩 
if grade >f: 
t[subject]=grade 
result [name]=t 
# 创建 Excel 文件 
workbook1=Workbook () 
worksheet 1= workbookl .worksheets [0] 
worksheet 1.append ([' 姓 名 ', ' 课 程 ', ' 成 绩 ']) 
# 将 result 字典 中 的 结果 数据 写 人 Excel 文 件 
for name, t in result.items(): 
for subject, grade in t.items(): 
worksheet1.append([name, subject, grade]) 
workbook1. save (newfile) 
if name =='_main_': 
oldfile=r'd:\test.xlsx' 
newfile=r'd:\result.xlsx' 
generateRandomInformation (oldfile) 
getResult (oldfile, newfile) 


例 7-26 编写 代码 ,查看 指定 zip 和 rar 压缩 文件 中 的 文件 列表 。 
Python 标准 库 zipfile 提供 了 对 zip 和 apk 文件 的 访问 。 


>>> import zipfile 
>>> fp=zipfile.ZipFile(r'D:\Jakstab- 0.8.3.zip") 
>>> for f in fp.namelist(): 
print (f) 
>>> fp.close () 


Python 扩展 库 rarfile( 可 通过 pip 工具 安装 ) 提 供 了 对 rar 文件 的 访问 。 


>>> import rarfile 
>>> r=rarfile.RarFile(r'D:\asp 网 站 .rar') 
>>> for f in r.namelist () : 

print (f) 


>>>r.close() 
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例 7-27 小 学 口算 题库 生成 器 。 
本 例 主要 演示 使 用 扩展 库 docx 创建 Word 文档 ,GUI 标准 库 tkinter 请 参见 第 9 章 。 


import random 
import os 

import tkinter 
import tkinter.ttk 


from docx import Document 
columnsNumber= 4 


def main (rowsNumber= 20, grade= 4) : 

if grade <3: 
operators='+-' 

biggest=20 

elif grade <=4: 
operators='+-X+' 
biggest=100 

elif grade ==5: 
operators='+- X + (' 


biggest=100 


document= Document () 
+ 创建 表格 
table= document .add_table (rows= rowsNumber, cols=columnsNumber) 
PADENA 
for row in range (rowsNumber) : 
for col in range (columnsNumber) : 
first= random. randint (1, biggest) 
second= random. randint (1, biggest) 


operator= random. choice (operators) 


if operator !='(': 
if operator =='-': 
# 如 果 是 减法 口算 题 ,确保 结果 为 正 数 


if first < second: 
first, second= second, first 
r=str (first) .ljust (2, '') +'' +operator+ str (second) .ljust (2, '') +'=" 
else: 

# 生 成 带 括号 的 口算 题 ,需要 3 个 数字 和 2 个 运算 符 
third=random.randint (1, 100) 
while True: 

ol= random. choice (operators) 

02= random. choice (operators) 


if ol !="(* and 02 !="(": 


break 
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rr=random.randint (1, 100) 
if rr>50: 
if o2=="—': 
if second < third: 
second, third=third, second 
r=str (first) .ljust (2, ' ') +ol+' ('\ 
+str(second) .ljust (2, ' ') +02 +str (third) .ljust (2, ' ') +')=" 
else: 
if ol =='-':; 
if first < second: 
first, second= second, first 
r='(' +str (first) .ljust(2, ' ') +01 \ 
+ str (second) .ljust (2, ' ') +')'\ 


+02 +str (third) .ljust (2, ' ') +' 
# 获 取 指 定单 元 格 并 写 人 口算 题 
cell=table.cell (row, col) 
cell.text=r 
document . save ('kousuan.docx') 


os.startfile('kousuan.docx') 


if name =='_main_': 
app=tkinter.Tk() 
app.title ('KouSuan------ by Dong Fuguo') 
app['width']=300 
app["height']=150 
labelNumber= tkinter.Label (app, text= 'Number:', justify=tkinter.RIGHT, width= 50) 
labelNumber.place (x=10, y=40, width= 50,height= 20) 
comboNumber= tkinter.ttk.Cambobox (app, values= (100, 200, 300,400,500), width=50) 
comboNumber.place (x= 70, y=40, width=50, height=20) 


labelGrade= tkinter.Label (app, text= 'Grade:', justify=tkinter.RIGHT, width= 50) 
labelGrade.place (x= 130, y=40, width= 50,height= 20) 

comboGrade= tkinter.ttk.Combobox (app, values= (1,2,3,4,5), width= 50) 
comboGrade.place (x= 200, y=40, width=50, height=20) 


def generate () : 

number= int (comboNumber.get () ) 

grade= int (comboGrade .get ()) 

main (number, grade) 
buttonGenerate=tkinter.Button (app, text='GO', width=40, command=generate) 
buttonGenerate.place (x= 130, y=90, width=40, height=30) 


app-mainloop () 
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本 章 小 结 


(1) 文件 操作 在 各 类 软件 开发 中 均 占有 重要 的 地 位 。 

(2) 二 进 制 文件 无 法 直接 读 取 和 理解 其 内 容 , 必 须 了 解 其 文件 结构 和 所 使 用 的 序列 化 
规则 并 使 用 正确 的 反 序列 化 方法 。 

(3) Python 内 置 了 文件 对 象 ,通过 open() 函 数 即 可 以 指定 模式 打开 指定 文件 并 创建 文 
件 对 象 。 

(4) Python 中 常用 的 序列 化 模块 有 struct、pickle、json、marshal 和 shelve, 其 中 pickle 
有 C 语言 实现 的 cPickle, 速 度 约 提 高 1000 倍 , 应 优先 考虑 使 用 。 

(5) 文件 对 象 的 读 、 写 方法 都 会 自动 改变 文件 指针 位 置 。 

(6) Python 2. x 和 Python 3. x 对 文件 对 象 的 读 、 写 方法 解释 略 有 不 同 , 尤 其 对 于 读 写 
内 容 包含 中 文 的 情况 。 

(7) os、os. path 和 shutil 模块 提供 了 大 量 用 于 文件 和 文件 夹 操作 的 方法 ,包括 文件 和 
文件 夹 的 移动 ,复制 .删除 . 重 命名 以 及 压缩 与 解压 缩 等 。 


J 题 


1. 假设 有 一 个 英文 文本 文件 ,编写 程序 读 取 其 内 容 , 并 将 其 中 的 大 写字 母 变 为 小 写字 
F ,小写 字母 变 为 大 写字 母 。 

2. 编写 程序 ,将 包含 学 生成 绩 的 字典 保存 为 二 进 制 文件 ,然后 再 读 取 内 容 并 显示 。 

3. 使 用 shutil 模块 中 的 move() 方 法 进行 文件 移动 。 

4. 简单 解释 文本 文件 与 二 进 制 文件 的 区 别 。 

5. 编写 代码 ,将 当前 工作 目录 修改 为 *C:\”, 并 验证 ,最 后 将 当前 工作 目录 恢复 为 原来 


的 目录 。 

6. 编写 程序 ,用 户 输入 一 个 目录 和 一 个 文件 名 ,搜索 该 目录 及 其 子 目 录 中 是 否 存在 该 
X: 

7. 文件 对 象 的 方法 用 来 把 缓冲 区 的 内 容 写 入 文件 ,但 不 关闭 文件 。 

8. os. path 模块 中 的 方法 用 来 测试 指定 的 路 径 是 否 为 文件 。 


9. os 模块 的 方法 用 来 返回 包含 指定 文件 夹 中 所 有 文件 和 子 文件 夹 的 列表 。 
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第 8 章 异常 处 理 结构 与 程序 调试 .测试 


简单 地 说 ,异常 是 指 程序 运行 时 引发 的 错误 ,引发 错误 的 原因 有 很 多 ,例如 除 0、 下 标 越 
界 、 文 件 不 存在 、 网 络 异常 .类 型 错误 、 名 字 错 误 、 字 典 键 错误 、 磁 盘 空 间 不 足 , 等 等 。 如 果 这 
些 错误 得 不 到 正确 的 处 理 将 会 导致 程序 终止 运行 ,而 合理 地 使 用 异常 处 理 结构 可 以 使 得 程 
序 更 加 健壮 ,具有 更 强 的 容错 性 ,不 会 因为 用 户 不 小 心 的 错误 输入 或 其 他 运行 时 原因 而 造成 
程序 终止 。 或 者 ,也 可 以 使 用 异常 处 理 结构 为 用 户 提供 更 加 友好 的 提示 。 程 序 出 现 异 常 或 
错误 之 后 是 否 能 够 调试 程序 并 快速 定位 和 解决 存在 的 问题 也 是 程序 员 综 合 水 平和 能 力 的 重 
要 体现 方式 之 一 。 


8.1 基本 概念 


什么 是 异常 呢 ? 让 我 们 先 来 看 几 个 示例 。 


>>> x, y=10, 5 

>>> a=x/y 

>>> print (A) # 拼 写 错误 ,Python 区 分 变量 名 等 标识 符 字母 的 大 小 写 
Traceback (most recent call last): 


File "<pyshell#2>", line 1, in<module> 


print A 

NameError: name 'A' is not defined 

>>> 10 * (1/0) # 除 0 错误 

ZeroDivisionError: division by zero 

>>> 4+ spam* 3 # 使 用 了 未 定义 的 变量 ,与 拼写 错误 的 情形 相似 
NameError: name 'spam' is not defined 

>>> '2" +2 # 对 象 类 型 不 支持 特定 的 操作 


TypeError: Can't convert 'int' object to str implicitly 

在 前 面 的 章节 中 ,出 现 过 多 次 类 似 的 信息 , 没 错 ,这 就 是 Python 异常 的 标准 表现 形式 。 
熟练 运用 异常 处 理 机制 对 于 提高 程序 的 健壮 性 和 容错 性 具有 重要 的 作用 ,同时 也 可 以 把 
Python 上 涩 难 懂 的 错误 提示 转换 为 友好 的 提示 显示 给 最 终 用 户 。 

异常 处 理 是 指 因为 程序 执行 过 程 中 出 错 而 在 正常 控制 流 之 外 采取 的 行为 。 严 格 来 说 ， 
语法 错误 和 迪 辑 错误 不 属于 异常 ,但 有 些 语法 或 逻辑 错误 往往 会 导致 异常 ,例如 ,由 于 大 小 
写 拼写 错误 而 试图 访问 不 存在 的 对 象 , 或 者 试图 访问 不 存在 的 文件 ,等 等 。 当 Python 检测 
到 一 个 错误 时 ,解释 器 就 会 指出 当前 程序 流 已 无 法 继续 执行 下 去 ,这 时 候 就 出 现 了 异常 。 当 
程序 执行 过 程 中 出 现 错误 时 Python 会 自动 引发 异常 ,程序 员 也 可 以 通过 raise 语句 显 式 地 
引发 异常 。 

尽管 异常 处 理 机 制 非常 重要 也 非常 有 效 ,但 不 建议 使 用 异常 来 代 蔡 常规 的 检查 ,例如 必 
要 的 if… Jelse 判断 。 在 编程 时 应 避免 过 多 依赖 于 异常 处 理 机 制 来 提高 程序 健壮 性 。 
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8.2 Python 异常 类 与 自 定义 异常 


下 面 较为 完整 地 展示 了 Python 内 建 异常 类 的 继承 层次 。 
BaseException 
+—SystemExit 
+—KeyboardInterrupt 
+—GeneratorExit 
+—Exception 
+—Stoplteration 
十 -一 ArithmeticError 
| +—FloatingPointError 
| +—OverflowError 
| +—ZeroDivisionError 
+—AssertionError 
+—AttributeError 
+—BufferError 
十 一 EOFError 
+—AmportError 
+—LookupError 
+—ndexError 
+—KeyError 
+—MemoryError 
+—NameError 
+—UnboundLocalError 
+—OSError 
+—BlockingIOError 
+—ChildProcessError 
+—ConnectionError 
| 十 一 BrokenPipeError 
| 十 一 ConnectionAbortedError 
| 十 一 ConnectionRefusedError 
| 十 一 ConnectionResetError 
十 一 FileExistsError 
十 一 FileNotFoundError 
+—nterruptedError 
+—sADirectoryError 
+—NotADirectoryError 
+—PermissionError 


十 一 ProcessLookupError 

+—TimeoutError 

+—ReferenceError 

+—RuntimeError 

+—NotImplementedError 

+—SyntaxError 

+—indentationError 
+—TabError 

+—SystemError 

+—TypeError 

+—ValueError 

+—UnicodeError 
+—UnicodeDecodeError 
+—UnicodeEncodeError 
+—UnicodeTranslateError 

+—Warning 

+—Deprecation Warning 


+—PendingDeprecationWarning 
+—RuntimeWarning 
+—SyntaxWarning 
+—User Warning 
+—F uture Warning 
4+—Import Warning 
+—UnicodeWarning 
+—Bytes Warning 
+—Resource Warning 

如 果 需 要 ,可 以 继承 Python 内 置 异 常 类 来 实现 自 


class ShortInputException (Exception) : 
" 自 定义 异常 类 。" 
def init__(self, length, atleast): 
Exception. init (self) 
self.length= length 
self.atleast=atleast 
try: 
s= input(" 请 输入 -->") 
if len(s)<3: 
raise ShortInputException (len (s), 3) 
except EOFError: 
print (' 您 输入 了 一 个 结束 标记 EOF") 
except ShortInputException as x: 


ery 


义 的 异常 类 ,例如 : 


Æ 
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print ('ShortInputException: 输入 的 长 度 是 2d, 长 度 至 少 应 是 sd' %(x.length, x.atleast)) 


else: 


print (' 没 有 异常 发 生 .') 
再 如 下 面 的 示例 : 


>>> class MyError (Exception) : 
def init (self, value): 
self.value=value 
def str (self): 
return repr (self.value) 
>>> try: 
raise MyError (2 * 2) 
except MyError as e: 
print ("My exception occurred, value:', e.value) 
My exception occurred, value: 4 
>>> raise MyError('oops!') 
Traceback (most recent call last): 
File "<stdin>", line 1, in? 


_ main .MyError: 'oops!" 


如 果 自 己 编写 的 某 个 模块 需要 抛 出 多 个 不 同 但 相关 的 异常 ,可 以 先 创建 一 个 基 类 ,然后 


创建 多 个 派生 类 分 别 表示 不 同 的 异常 。 
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class Error (Exception) : # 创 建 基 类 
Pass 
class InputError (Error) : # 派 生 类 InputError 


"""Exception raised for errors in the input. 
Attributes: 
expression - - input expression in which the error occurred message -- explanation 
of the error 
mm 
def init__(self, expression, message) : 
self.expression= expression 


self.message=message 


class TransitionError (Error) : # 派 生 类 TransitionError 


"""Raised when an operation attempts a state transition that's not allowed. 
Attributes: 


previous - - state at beginning of transition 
next — -attempted new state 
message - -explanation of why the specific transition is not allowed 


def init (self, previous, next, message) : 
self.previous=previous 


self.next=next 
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self .message=message 


8.3 Python 中 的 异常 处 理 结构 
8.3.1 try…except 结构 


异常 处 理 结构 中 最 常见 也 最 基本 的 是 try…except… 结 构 。 其 中 try 子 句 中 的 代码 块 包 
含 可 能 出 现 异常 的 语句 ,而 except 子 句 用 来 捕捉 相应 的 异常 ,except 子 句 中 的 代码 块 用 来 
处 理 异常 。 如 果 try 中 的 代码 块 没有 出 现 异常 . 则 继续 往 下 执行 异常 处 理 结 构 后 面 的 代码 ; 
如 果 出 现 异常 并 且 被 except 子 句 捕获 , 则 执行 except 子 句 中 的 异常 处 理 代码 ; 如果 出 现 异 
常 但 没有 被 except 捕获 , 则 继续 往外 层 抛 出 ;如 果 所 有 层 都 没有 捕获 并 处 理 该 异常 , 则 程序 
终止 并 将 该 异常 抛 给 最 终 用户 。 该 结构 语法 如 下 : 


try: 

try 块 # 被 监控 的 语句 ,可 能 会 引发 异常 
except Exception[as reason]: 

except 块 # 处 理 异常 的 代码 


如 果 需 要 捕获 所 有 类 型 的 异常 ,可 以 使 用 BaseException, 即 Python 异常 类 的 基 类 , 代 
码 格式 如 下 : 


try: 


except BaseException as e: 


except JR # 处 理 所 有 错误 

上 面 的 结构 可 以 捕获 所 有 异常 ,尽管 这 样 做 很 安全 ,但 是 一 般 并 不 建议 这 样 做 。 对 于 异 
常 处 理 结构 ,一般 的 建议 是 尽量 显 式 捕 提 可 能 会 出 现 的 异常 ,并 且 有 针对 性 地 编写 代码 进行 
处 理 , 因 为 在 实际 应 用 开发 中 ,很 难 使 用 同一 段 代码 去 处 理 所 有 类 型 的 异常 。 当 然 ,为 了 避 
免 遗 漏 没 有 得 到 处 理 的 异常 干扰 程序 的 正常 执行 ,在 捕捉 了 所 有 可 能 想到 的 异常 之 后 ,也 可 
以 使 用 异常 处 理 结构 的 最 后 一 个 except 来 捕捉 BaseException 。 

下 面 的 代码 演示 了 try…except… 结 构 的 用 法 .代码 运行 后 提示 用 户 输入 内 容 , 如 果 输 
入 的 是 数字 , 则 循环 结束 ,否则 一 直 提 示 用 户 输入 正确 格式 的 内 容 。 


>>> while True: 
try: 
x= int (input ("Please enter a number: ")) 
break 
except ValueError: 
print ("That was not a valid number. Try again") 


在 使 用 时 ,except 子 句 可 以 在 异常 类 名 字 后 面 指定 一 个 变量 ,用 来 捕获 异常 的 参数 或 更 
详细 的 信息 。 


>>> try: 
raise Exception('spam', 'eggs') 
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except Exception as inst: 


print (type (inst))  #the exception instance 
print (inst .args) #arguments stored in .args 
print (inst) # str allows args to be printed directly, 


#but may be overridden in exception subclasses 
x, y=inst.args #unpack args 
print ('x=', x) 


print ('y=', y) 


8.3.2 try…except…else 结构 


另外 一 种 常用 的 异常 处 理 结构 是 try…except…else… 语 句 。 正 如 前 面 章节 中 已 经 提 到 
过 , 带 else 子 句 的 异常 处 理 结构 也 是 一 种 特殊 形式 的 选择 结构 。 如 果 try 中 的 代码 抛 出 了 
异常 ,并 且 被 某 个 except 捕 提 , 则 执行 相应 的 异常 处 理 代码 ,这 种 情况 下 不 会 执行 else 中 的 
代码 ;如 果 try 中 的 代码 没有 抛 出 任何 异常 , 则 执行 else 块 中 的 代码 。 


a_list=['China', 'America', 'England', 'France'] 
while True: 
n= input (" 请 输入 字符 串 的 序号 :”) 
try: 
n= int (n) 
print (a_list[n]) 
except IndexError: 
print (' 列 表 元 素 的 下 标 越界 或 格式 不 正确 ,请 重新 输入 字符 串 的 序号 ') 
else: 


break # 结 束 循环 


8.3.3 带 有 多 个 except 的 try 结构 


在 实际 开发 中 ,同一 段 代码 可 能 会 抛 出 多 个 异常 ,需要 针对 不 同 的 异常 类 型 进行 相应 的 
处 理 。 为 了 支持 多 个 异常 的 捕捉 和 处 理 , Python 提供 了 带 有 多 个 except 的 异常 处 理 结构 ， 
类 似 于 多 分 支 选 择 结构 。 一 旦 某 个 except 捕获 了 异常 , 则 后 面 剩 余 的 except 子 句 将 不 会 再 
执行 。 该 结构 的 语法 为 : 


try: 

try 块 # 被 监控 的 语句 
except Exceptionl: 

except $ 1 # 处 理 异 常 1 的 语句 
except Exception2: 

except 块 2 # 处 理 异 常 2 的 语句 


下 面 的 代码 演示 了 该 结构 的 用 法 : 


try: 
zinput(" 请 输入 被 除数 : *) 
y= input ("请 输入 除数 : ') 
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z= float (x) / float (y) 
except ZeroDivisionError: 
print (' 除 数 不 能 为 0') 
except TypeError: 
print ("被 除数 和 除数 应 为 数值 类 型 ') 
except NameError: 
print ("变量 不 存在 ') 
else: 


print (x, '/', y, '=', 2) 


将 要 捕获 的 异常 写 在 一 个 元 组 中 ,可 以 使 用 一 个 except 语句 捕获 多 个 异常 ,并 且 共 用 
同一 段 异 常 处 理 代码 ,当然 ,除非 确定 要 捕获 的 多 个 异常 可 以 使 用 同一 段 代码 来 处 理 , 否 则 
并 不 建议 这 样 做 。 

import sys 

try: 

f=open ('myfile.txt') 
s=f.readline() 
i= int (s.strip()) 

except (OSError, ValueError, RuntimeError, NameError) : 

pass 


8.3.4 try…except…finally 结构 


最 后 一 种 常用 的 异常 处 理 结构 是 try…except…finally… 结 构 。 在 该 结构 中 ,finally 子 
句 中 的 语句 块 无 论 是 否 发 生 异 常 都 会 执行 ,常用 来 做 一 些 清理 工作 以 释放 try 子 句 中 申请 
的 资源 。 语 法 如 下 : 


try: 


finally: 
# 无 论 如 何 都 会 执行 的 代码 


例如 下 面 的 代码 ,无 论 是 否 发 生 异 常 , 语 句 print(5) 都 会 被 执行 。 


>>> try: 
3/0 
except: 
print (3) 
finally: 
print (5) 
3 
5 


再 如 下 面 的 代码 ,无 论 读 取 文 件 是 否 发 生 异 常 ,总 是 能 够 保证 正常 关闭 该 文件 。 


try: 
f=open('test.txt', 'r') 
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line=f.readline () 
print (line) 
finally: 
f.close() 


需要 注意 的 一 个 问题 是 ,如 果 try 子 句 中 的 异常 没有 被 捕捉 和 处 理 ,或 者 except 子 句 或 
else 子 句 中 的 代码 出 现 了 异常 ,那么 这 些 异 常 将 会 在 finally 子 句 执行 完 后 再 次 抛 出 。 

例如 下 面 的 代码 ,在 try 中 的 语句 出 现 了 异常 但 是 没有 得 到 处 理 , 因 此 ,finally 中 的 语 
句 执行 完 以 后 再 次 抛 出 该 异常 。 


>>> try: 
3/0 
finally: 
print (5) 
5 


ZeroDivisionError: division by zero 
下 面 的 代码 较为 完整 地 演示 了 这 种 情况 。 


>>> def divide (x, y): 
try: 
result=x / y 
except ZeroDivisionError: 
print ("division by zero!") 
else: 
print ("result is", result) 
finally: 
print ("executing finally clause") 
>>> divide (2, 1) 
result is 2.0 
executing finally clause 
>>> divide (2, 0) 
division by zero! 
executing finally clause 
>>> divide ("2", "1") 
executing finally clause 


TypeError: unsupported operand type(s) for /: 'str' and 'str' 


另外 ,finally 中 的 代码 也 可 能 会 抛 出 异常 ,例如 下 面 的 代码 ,使 用 异常 处 理 结构 的 本 意 
是 为 了 防止 文件 读 取 操作 出 现 异常 而 导致 文件 不 能 正常 关闭 ,但 是 如 果 因 为 文件 不 存在 而 
导致 文件 对 象 创建 失败 ,那么 finally 子 句 中 关闭 文件 对 象 的 代码 将 会 抛 出 异常 从 而 导致 程 
序 终 止 运行 。 

>>> try: 

f=open('test.txt', 'r') 
line=£.readline () 


print (line) 
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finally: 
f.close() 
NameError: name 'f' is not defined 


最 后 ,使 用 带 有 finally 子 句 的 异常 处 理 结构 时 ,应 尽量 避免 在 finally 子 句 中 使 用 
return 语句 ,否则 可 能 会 出 现 出 乎 意料 的 错误 ,例如 下 面 的 代码 : 


>>> def demo div (a, b): 
try: 
return a/b 
except: 
pass 
finally: 
return -1 
>>> demo_div(1, 0) 
= 
>>> demo_div(1, 2) 
=A! 
通过 本 节 的 介绍 ,相信 你 已 经 了 解 和 掌握 了 Python 异常 处 理 结构 的 原理 和 用 法 。 简 
单 总 结 一 下 ,可 以 理解 为 “请 求 原 谅 比 请 求 允 许 要 容易 ”。 也 就 是 说 ,有 些 代 码 执 行 可 能 会 出 
现 错误 ,也 可 能 不 会 出 现 错误 ,这 主要 由 运行 时 的 各 种 客观 因素 决定 ,此 时 建议 使 用 异常 处 
理 结构 。 如 果 使 用 大 量 的 选择 结构 来 提前 判断 , 仅 当 满足 相应 条 件 时 才 执 行 该 代码 ,这 些 条 
件 判断 可 能 会 严重 干扰 正常 的 业务 逻辑 ,也 会 严重 降低 代码 的 可 读 性 。 


8.4 断言 与 上 下 文 管理 


断言 与 上 下 文 管理 是 两 种 特殊 的 异常 处 理 方式 ,在 形式 上 比 异 常 处 理 结构 要 简单 一 些 ， 
能 够 满足 简单 的 异常 处 理 或 条 件 确认 ,并且 可 以 与 标准 的 异常 处 理 结构 结合 使 用 。 


8.4.1 断言 
断言 语句 的 语法 是 : 
assert expression[, reason] 


当 判 断 表 达 式 expression 为 真 时 ,什么 都 不 做 ;如 果 表 达 式 为 假 , 则 抛 出 异常 。 

assert 语句 一 般 用 于 对 程序 某 个 时 刻 必 须 满足 的 条 件 进 行 验证 , 仅 当 ”_ debug _“ 为 
True 时 有 效 。 当 Python 脚本 以 -O 选项 编译 为 字 节 码 文件 时 ,assert 语句 将 被 移 除 以 提高 
运行 速度 。 

断言 和 异常 处 理 结构 经 常 结合 使 用 ,例如 : 

>>> try: 

assert 1==2, "1 is not equal 2!" 
except AssertionError as reason: 


print ("$s:%s"% (reason. class . name , reason)) 
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AssertionError:1 is not equal 2! 


8.4.2 上 下 文 管理 


使 用 上 下 文 管理 语句 with 可 以 自动 管理 资源 ,在 代码 块 执行 完毕 后 自动 还 原 进入 该 代 
码 块 之 前 的 现场 或 上 下 文 。 不 论 何 种 原因 跳出 with 块 ,也 不 论 是 否 发 生 异常 ,总 能 保证 资 
源 被 正确 释放 ,大 大 简化 了 程序 员 的 工作 ,常用 于 文件 操作 、 网 络 通信 之 类 的 场合 。 

with 语句 的 语法 如 下 : 


with context_expr [as var]: 
with 块 


例如 ,下 面 的 代码 演示 了 文件 操作 时 with 语句 的 用 法 ,使 用 这 样 的 写法 程序 员 丝毫 不 
用 担心 忘记 关闭 文件 , 当 文件 处 理 完 以 后 ,将 会 自动 关闭 。 


with open('D:\\test.txt") as f: 
for line in f: 


print (line) 


8.5 用 sys 模块 回溯 最 后 的 异常 * 


当 发 生 异 常 时 ,Python 会 回溯 异常 ,给 出 大 量 的 提示 ,可 能 会 给 程序 员 的 定位 和 纠 错 带 
来 一 定 的 困难 ,这 时 可 以 使 用 sys 模块 来 回溯 最 近 一 次 异常 。 语 法 为 


import sys 

try: 
block 

except: 
t=sys.exc_info() 


print (t) 


sys. exc_info() 的 返回 值 是 一 个 三 元 组 (type，value/ message，traceback) 。 其 中 ,type 表示 
异常 的 类 型 ,value/ message 表示 异常 的 信息 或 者 参数 ,而 traceback 则 包含 调用 栈 信息 的 对 象 。 
例如 ,下 面 的 代码 演示 了 其 用 法 : 


>>> 1/0 
ZeroDivisionError: integer division or modulo by zero 
>>> import sys 
>>> try: 
1/0 
except: 
r=sys.exc_info() 
print (r) 
(<class 'ZeroDivisionError'>, ZeroDivisionError ('division by zero',),<traceback object at 


0x000000000375C788> ) 


194 


异常 处 理 结构 与 程序 调试 、 测 试 


下 面 的 代码 演示 了 标准 的 异常 跟踪 和 sys.exc_info() 之 间 的 区 别 , 可 以 看 出 ， 
sys. exc_info() 可 以 直接 定位 最 终 引发 异常 的 原因 ,结果 也 比较 简洁 ,但 是 缺点 是 难以 直接 
确定 引发 异常 的 代码 位 置 : 


>>> def A(): 
1/0 
>>> def B(): 
A() 
>>> def C(): 
B() 
>>> C() 
ZeroDivisionError: integer division or modulo by zero 
>>> try: 
c() 
except: 
r=sys.exc_info() 
print (r) 
(<type 'exceptions. ZeroDivisionError'>, ZeroDivisionError (‘integer division or modulo by 
zero',),<traceback object at 0x0134C990> ) 


8.6 使 用 IDLE 调试 代码 


当 程序 运行 发 生 错 误 或 者 得 到 了 非 预期 的 结果 时 ,是 否 能 够 熟练 地 对 程序 进行 调试 并 
快速 定位 和 解决 问题 是 体现 程序 员 综合 能 力 的 重要 标准 之 一 。 

几乎 任何 一 种 集成 开发 环境 都 提供 了 代码 调试 功能 ,Python 标准 开发 环境 IDLE 也 不 
例外 。 使 用 IDLE 的 调试 功能 时 ,首先 单 击 IDLE 的 Debug Debugger 菜单 命令 打开 调试 
器 窗口 ,然后 打开 并 运行 要 调试 的 程序 ,最 后 切换 到 调试 器 窗口 使 用 其 中 的 控制 按钮 进行 调 
试 。 如 图 8-1 所 示 为 IDLE 调试 窗口 及 其 功能 简要 介绍 ,可 以 使 用 调试 按钮 对 程序 进行 单 
步 执行 ,实时 查看 变量 的 当前 值 并 跟踪 其 变化 过 程 ,对 于 理解 程序 内 部 工作 原理 和 发 现 程序 


Debug Control 


显示 当前 执行 的 代码 
显示 所 有 全 局 变量 
显示 所 有 局 部 变量 


当前 执行 行内 容 


Globals 
e’ builtin” (built-in)> 


8-1 IDLE 调试 器 窗口 
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中 存在 的 问题 非常 有 帮助 。 图 8-2 和 图 8-3 是 使 用 IDLE 对 例 5-2 的 程序 进行 调试 过 程 中 
的 两 个 截图 , 单 击 调试 窗口 上 的 Step 按钮 进行 单 步 执行 ,可 以 清晰 地 观察 程序 执行 过 程 中 
数据 的 变化 。 


[LS Debug Control 


b'.run0, line 431: exec(emd, globals, locals) bun0 line 431: exec{emd, globals, locals) 
"_main_!.<module>0, line 6: print(demo(2,2,3,4)) "_main_'.<module>0, line 6: print(demo(1.2,3,4)) 
main_'demo0 line 4: g = [i for i in para if imavg) 


.0 <tuple iterator object at 0x000000000377BAS8> 
avg 25 


图 8-2 程序 调试 截图 (一 ) 图 8-3 程序 调试 截图 (二 ) 


8.7 使 用 pdb 模块 调试 程序 * 
8.7.1 pdb 模块 常用 命令 
pdb 是 Python 自 带 的 交互 式 源 代码 调试 模块 ,使 用 该 模块 可 以 完成 代码 调试 的 绝 大 部 分 
功能 ,包括 设置 /清除 (条 件 ) 断 点 、 启 用 /禁用 断 点 、 单 步 执行 .查看 栈 帧 ,查看 变量 值 .查看 当前 
执行 位 置 . 列 出 源 代码 ,执行 任意 Python 代码 或 表达 式 等 。pdb 还 支持 事后 调试 ,可 在 程序 控 
制 下 被 调用 ,并 且 可 以 通过 pdb Al cmd 接口 对 该 调试 器 进行 扩展 。pdb 模块 常用 调试 命令 如 


表 8-1 所 示 。 
表 8-1 常用 pdb 调试 命令 
简写 /完整 命令 用 法 示例 解释 
a 显示 当前 函数 中 的 参数 
b 173 在 173 行 设置 断 点 
helion 在 function 函数 第 一 条 可 执行 语句 位 置 设置 断 点 
De filename: linen: ; 不 带 参数 则 列 出 所 有 断 点 ,包括 每 个 断 点 的 触发 次 
9 数 、 当 前 忽略 计数 以 及 与 之 关联 的 条 件 
175 condition | 设置 条 件 断 点 , 仅 当 condition 的 值 为 True 时 该 断 点 
有 效 
al 清除 所 有 断 点 
sana : eae hey | a filenames lineno| ABR FX PH 15 89 BEAT 
1359 删除 第 3.5 .9 个 断 点 
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续 表 
简写 /完整 命令 用 法 示例 解 释 
condition 3 a<b | 仅 当 a<b 时 3 号 断 点 有 效 
condition bpnumber [condition] 
condition 3 将 3 号 断 点 设置 为 无 条 件 断 点 
continue 继续 运行 至 下 一 个 断 点 或 脚本 结束 
disable [bpnumber disable 35 禁用 第 3、5 个 断 点 ,禁用 后 断 点 仍 存在 ,可 以 再 次 被 
[bpnumber ...]] a a 启用 
d(own) 在 栈 跟 踪 器 中 向 下 移动 一 个 栈 帧 
enable [bpnumber 
[opmamber:: enable n 启用 第 n 个 断 点 
h(elp) [command] 查看 pdb 帮助 
为 断 点 设置 忽略 计数 ,count 默认 值 为 0。 若 某 断 点 
ignore bpnumber [count] 的 忽略 计数 不 为 0, 则 每 次 触发 时 自动 减 1, 当 忽略 计 
数 为 0 时 该 断 点 处 于 活动 状态 
jCump) j 20 跳 至 第 20 行 继续 运行 


Ist) [first [,last]] 


列 出 脚本 清单 ,默认 11 行 


列 出 从 第 m 行 到 第 n 之 间 的 脚本 代码 


列 出 从 第 m 行 开始 的 11 行 代码 


n(ext) 


执行 下 一 条 语句 ,过 到 函数 时 不 进入 其 内 部 


p(rint) pi 打印 变量 i 的 值 

qluit) 退出 pdb 调试 环境 

r(eturn) 一 直 运 行 至 当前 函数 返回 

和 设置 临时 断 点 ,该 类 型 断 点 只 被 中 断 一 次 ,触发 后 该 
断 点 自动 删除 

step 执行 下 一 条 语句 ,过 到 函数 时 进入 其 内 部 

u(p) 在 栈 跟踪 器 中 向 上 移动 一 个 栈 帧 

w(here) 查看 当前 栈 帧 


C! statement 


在 pdb 中 执行 语句 ,! 与 要 执行 的 语句 之 间 不 需要 空 
格 , 任 何 非 pdb 命令 都 被 解释 为 Python 语句 并 执行 ， 
甚至 可 以 调用 函数 或 修改 当前 上 下 文中 变量 的 值 


直接 回 车 


默认 执行 上 一 个 命令 


8.7.2 使 用 pdb 模块 调试 Python 程序 


可 以 通过 三 种 不 同 的 形式 来 使 用 pdb 模块 提供 的 调试 功能 ,分 别 为 在 交互 模式 下 调试 
特定 的 代码 块 、 在 程序 中 显 式 插入 断 点 以 及 把 pdb 作为 模块 来 调试 程序 。 
D 在 交互 模式 下 使 用 pdb 模块 提供 的 功能 可 以 直接 调试 语句 块 、 表 达 式 、 函 数 等 多 种 
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脚本 ,常用 的 调试 方法 有 : 

© pdb. run(statement[, globals[ , locals ]]) 调试 指定 语句 ,可 选 参 数 globals 和 
locals 用 来 指定 代码 执行 的 环境 ,默认 是 ”_ main “模块 的 字典 。 

@ pdb. runeval ( expression [, globals [, locals]]) 一 一 返回 表达 式 的 值 ,可 选 参数 
globals 和 locals 的 含义 与 上 面 的 run() 函数 一 样 。 

® pdb. runcall(function[ ,argument, ...]) 调试 指定 函数 。 

@ pdb. post_mortem([traceback]) 一 一 进入 指定 traceback 对 象 的 事后 调试 模式 , 如 
果 没 有 指定 traceback 对 象 , 则 使 用 当前 正在 处 理 的 一 个 异常 。 

例如 ,下 面 的 代码 演示 了 如 何 调试 一 个 函数 ,其 中 *(Pdb) "为 提示 符 , 在 后 面 输入 并 执 
行 前 面 表 8-1 中 介绍 的 命令 即 可 。 


>>> import pdb 
>>> def £(): 

x=5 

print (x) 
>>> pdb. runcall (f) 
><pyshell#5> (2) £() 
(Pdb) n 
><pyshell#5> (3) £() 
(Pdb) 1 
[EOF] 
(Pdb) p x 
5 
(Pdb) n 
5 
--Return-- 
><pyshel1#5> (3) £()->None 
(Pdb) n 
>>> 


(2) 在 程序 中 嵌入 断 点 来 实现 调试 功能 。 

在 程序 中 首先 导入 pdb 模块 ,然后 使 用 pdb. set_trace() 在 需要 的 位 置 设置 断 点 。 如 果 
程序 中 存在 通过 该 方法 显 式 插入 的 断 点 ,那么 在 命令 提示 符 环境 下 执行 该 程序 或 双击 执行 
程序 时 将 自动 打开 pdb 调试 环境 ,即使 该 程序 当前 不 处 于 调试 状态 。 例 如 ,下 面 的 程序 
IsPrime. py: 


import pdb 


n=37 
pdb.set_trace() 
for i in range (2, n): 
if ngi==0: 
print ("No") 
break 
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测试 


else: 
print ("Yes") 
由 于 使 用 pdb 设置 的 断 点 ,运行 后 自动 打开 调试 模式 ,如 图 8-4 所 示 。 
在 命令 提示 符 环境 中 运行 该 程序 同样 自动 打开 调试 模式 ,如 图 8-5 所 示 。 


RESTART: 


py © as hl 


> c: 和 

Ba? for i in range (2, 

> ce: Dn py (6) <module> () 
0: 


>c: z\python38\isprine. py (6) <module> () 


S-a i in range (2, [C=\Python35>python IsPrime.py 


Pa) pi > ©: \python35 \isprime . py(5)<module ><> 
es |-> for i in range<2,n>: 
S ii KPdb> p i 
2,2 \pyghons6\isprine. py (6) <aodule>() [exw NaneError: name ’i’ is not defined 
(Pab) n KPdb> n 
aera we <nodule> () > ©: \python35 \ispriine . py<6><module ><> 
2 ms |-> if nxi == @: 

(人 
de Re thond6\isprine. py (6) <module> () KPab> p i 
-> if Wi == 0: l2 
(Pdb) p i <Pdb) 1 
om) a 1 import pdb 
(Pdb) 1 2 

1 inport pdb 3 n = 3? 

2 _ 4 pdb.set_trace(> 

a. SR tetrad 5 for i in range<2,n>: 

5 for i in range(2, n): 6 > if nzi == 6: 

6 if ni == 0: 7 print’ No’ > 

H print C Ro') 8 break 

baa 9 else: 
Boe ee 10 print Yes’) 
[EOF] 
<Pdb> 
图 8-4 自动 打开 调试 模式 (一 ) 图 8-5 自动 打开 调试 模式 (二 ) 


(3) 使 用 命令 行 调试 程序 。 

在 命令 提示 符 下 执行 “python -m pdb 脚本 文件 名 ”, 则 直接 进入 调试 环境 ; 当 调试 结束 
或 程序 正常 结束 以 后 ,pdb 将 六 程序 。 把 上 面 的 程序 中 pdb 模块 的 导入 和 断 点 插入 所 
数 都 删除 ,然后 在 命令 提示 符 环境 中 使 用 调试 模式 运行 ,如 图 8-6 所 示 。 


[E\Python35>python -m pdb IsPrine.py 
©? \python35\isprime .pyC1><module ><> 
F> n = 37 
Pdb> n 
©: \python35 \isprine .py(2><module ><> 
+> for i in range<2,n>: 
\Pdb> w 
¢=\python35\1Lib\bdb.py(431 rund) 
f> execCend, globals, locals) 
<string><1><module><> 
©: \python35 \isprine . py(2><module><> 
+> for i in range<2,n>: 
kPaby n 
> ¢:\python35\isprime . py(3><module><> 
+> if nzi == 
ee pi 


Pdb> p n 


2 
Pdb> 


8-6 ”以 调试 模式 运行 程序 
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8.8 Python 单元 测试 * 


软件 测试 对 于 保证 软件 质量 非常 重要 ,尤其 是 系统 升级 过 程 中 对 代码 的 改动 不 应 该 影 
响 原 有 功能 ,软件 测试 是 未 来 重 构 代码 的 信心 保证 。 几 乎 所 有 软件 公司 都 有 专门 的 测试 团 
队 来 保证 软件 质量 ,但 作为 程序 员 ,首先 应 该 保证 自己 编写 的 代码 准确 无 误 地 实现 了 预定 功 
能 ,单元 测试 是 保证 模块 质量 的 重要 手段 之 一 。 从 软件 工程 角度 来 讲 ,软件 测试 分 为 白 盒 测 
试 和 黑 盒 测 试 。 其 中 , 白 盒 测试 主要 通过 阅读 程序 源 代 码 来 判断 是 否 符合 功能 要 求 , 对 于 复 
杂 的 业务 逻辑 白 盒 测试 难度 非常 大 ,一 般 以 黑 盒 测试 为 主 , 白 盒 测 试 为 辅 。 黑 盒 测试 不 关心 
模块 的 内 部 实现 方式 ,只 关心 其 功能 是 否 正确 ,通过 精心 设计 一 些 测试 用 例 检验 模块 的 输入 


和 输出 是 否 正确 来 判断 其 是 否 符合 预定 的 功能 要 求 。 
通过 单元 测试 的 方式 来 管理 设计 好 的 测试 用 例 , 不 仅 可 以 避免 人 工 输入 可 能 引入 的 错 

误 ,还 可 以 重复 利用 设计 好 的 测试 用 例 , 具 有 很 好 的 可 扩展 性 。Python 标准 库 unittest 提 

供 了 大 量 用 于 单元 测试 的 类 和 方法 ,其 中 TestCase 类 的 常用 方法 如 表 8-2 所 示 。 


表 8-2 TestCase 常用 方法 


方法 名 称 


功能 说 明 


方法 名 称 


功能 说 明 


assertEqual(a,b) 


a==b 


assertNotEqual(a,b) 


al=b 


assertTrue(x) bool(x) is True assertFalse(x) bool(x) is False 
assertls(a,b) aisb assertIsNot(a+b) ais not b 
assertIsNone( x) x is None assertIsNotNone(x) x is not None 
assertIn(a,b) ainb assertNotIn(a,b) a not in b 


assertIsInstance(a,b) 


isinstance(a,b) 


assertNotIsInstance(a,b) 


not isinstance(a,b) 


assertAlmostEqual(a, b) 


round(a-b, 7)==0 


assertNotAlmostEqual(a, b) 


round(a-b,7)!=0 


assertGreater(a,b) a>b assertGreaterEqual(a, b) a>=b 

assertLess(a,b) a<b assertLessEqual(a, b) a<=b 

assertRegex(s.r) r. search(s) assertNotRegex(s. r) not r. search(s) 

setUpO 每 项 测试 开始 之 前 自动 PEE E 每 项 测试 完成 之 后 自 
调用 该 函数 动 调用 该 函数 


其 中 setUp() 和 tearDown() 这 两 个 方法 比较 特殊 ,分 别 在 每 个 测试 之 前 和 之 后 自动 调 


用 ,党 
代码 。 
例 8-1 


编写 单元 测试 程序 。 


来 执行 数据 库 连 接 的 创建 与 关闭 文件 的 打开 与 关闭 等 操作 ,避免 编写 过 多 的 重复 


以 第 2 章 自 定义 栈 的 代码 为 例 ,演示 如 何 利 用 unittest 库 对 Stack 类 中 的 入 栈 、 出 栈 、 改 
变 大 小 以 及 满 / 空 测 试 等 方法 进行 测试 ,并 将 测试 结果 写 入 文件 test_Stack_result. txt。 


# 要 测试 的 模块 ,在 本 书 第 2 章 
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Fe IBS 


import Stack 
# Python 单元 测试 标准 库 


import unittest 


class TestStack (unittest .TestCase) : 
def setUp (self): 
# 测 试 之 前 以 追加 模式 打开 指定 文件 


self.fp=open('D:\\test_Stack_result.txt', 'at') 


def tearDown (self): 
# 测 试 结束 后 关闭 文件 
self.fp.close() 


def test isEmpty (self) : 
try: 
s=Stack.Stack() 
# 确 保函 数 返回 结果 为 True 
self.assertTrue(s.isEmpty()) 
self.fp.write (‘isEmpty passed\n') 
except Exception as e: 


self.fp.write('isEmpty failed\n') 


def test_empty (self): 
try: 
s=Stack.Stack (5) 
for iin f'a", "bt "erje 
s.push (i) 
# 测 试 清空 栈 操作 是 否 工 作 正常 
s.empty () 
self.assertTrue(s.isEmpty()) 
self.fp.write ('empty passed\n') 
except Exception as e: 


self.fp.write ("empty failed\n') 


def test_isFull (self): 
try: 
s= Stack. Stack (3) 
s-push (1) 
s-push (2) 
s-push (3) 
self-assertTrue(s.isFull()) 
self.fp.write ('isFull passed\n') 
except Exception as e: 


self .fp.write("isFull failed\n') 
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def test pushpop (self) : 
try: 
s= Stack.Stack() 
s.push (3) 
# 确 保 入 栈 后 立刻 出 栈 得 到 原来 的 元 素 
self.assertEqual (s-pop(), 3) 
s.push('a') 
self.assertEqual (s.pop(), 'a') 
self.fp.write ('push and pop passed\n') 
except Exception as e: 


self.fp.write ('push or pop failed\n') 


def test_setSize (self): 

try: 
= Stack.Stack (8) 
for i in range (8): 

s.push (i) 

self .assertTrue(s.isFull()) 
# 测 试 扩大 栈 空间 是 否 正常 工作 
s.setSize (9) 
s.push (8) 
self.assertTrue(s.isFull()) 
self.assertEqual (s.pop(), 8) 
# 测 试 缩小 栈 空间 是 否 正常 工作 
s.setSize (4) 
self .assertTrue(s.isFull()) 
self.assertEqual (s.pop(), 3) 
self.fp.write('setSize passed\n') 

except Exception as e: 


self.fp.write('setSize failed\n') 


if _name =='_ main ': 
unittest .main() 

最 后 需要 说 明 的 是 : 四 测试 用 例 的 设计 应 该 是 完备 的 ,应 保证 覆盖 尽 可 能 多 的 情况 ,万 
其 是 要 覆盖 边界 条 件 , 对 目标 模块 的 功能 进行 充分 测试 ,避免 漏 测 ; @ 测 试用 例 以 及 测试 代 
码 的 设计 与 编写 也 可 能 会 存在 bug, 通 过 测试 并 不 代表 目标 代码 没有 错误 ,但 是 一 般 而 言 ， 
不 能 通过 测试 的 模块 代码 是 存在 问题 的 ; @ 再 好 的 测试 方法 和 测试 用 例 也 无 法 保证 能 够 发 
现 所 有 错误 ,只 能 通过 改进 和 综合 多 种 测试 方法 并 且 精 心 设计 测试 用 例 来 发 现 尽 可 能 多 的 
潜在 问题 ; @ 除 了 功能 测试 ,还 应 对 程序 进行 性 能 测试 与 安全 性 测试 ,甚至 还 需要 进行 规范 
性 测试 以 保证 代码 可 读 性 和 可 维护 性 。 
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本 章 小 结 


(1) 程序 出 现 异常 或 错误 后 是 否 能 够 调试 程序 并 快速 定位 和 解决 存在 的 问题 是 程序 员 
综合 水 平和 能 力 的 重要 体现 方式 之 一 。 

(2) 异常 处 理 结构 可 以 提高 程序 的 容错 性 和 健壮 性 ,但 不 建议 过 多 依赖 异常 处 理 结构 。 

(3) 可 以 继承 Python 内 建 异 常 类 来 实现 自 定 义 的 异常 类 。 

(4) 可 以 使 用 BaseException 来 捕获 所 有 异常 ,但 不 建议 这 样 做 。 

(5) 异常 处 理 结构 中 主要 的 关键 字 有 try except, finally 和 else. 

(6) 异常 处 理 结构 中 也 可 以 使 用 else 子 句 , 当 没 有 异常 发 生 时 执行 else 子 句 中 的 代 
码 块 。 

(7) 断言 语句 assert 一 般 用 于 对 程序 某 个 时 刻 必须 满足 的 条 件 进行 验证 。 

(8) 上 下 文 管理 语句 with 在 代码 块 执行 完毕 后 能 够 自动 还 原 进 入 代码 块 之 前 的 现场 
或 上 下 文 ,不 论 是 否 发 生 异 常 总 能 保证 资源 被 正确 释放 。 

CO) 异常 处 理 结构 的 finally 子 句 中 的 代码 仍 可 能 会 抛 出 异常 。 

(10) 可 以 使 用 sys 模块 来 回溯 引发 异常 的 最 直接 原因 。 

(11) 可 以 通过 三 种 方式 使 用 pdb 模块 的 调试 功能 : 在 交互 模式 下 使 用 pdb 模块 的 方 
法 调试 指定 函数 或 语句 、 在 程序 中 显 式 插入 断 点 .执行 Python 程序 时 指定 pdb 调试 模块 。 

(12) 白 盒 测试 主要 通过 阅读 程序 源 代码 来 判断 是 否 符合 功能 要 求 , 对 于 复杂 的 业务 好 
辑 白 盒 测试 难度 非常 大 ,一般 以 黑 盒 测 试 为 主 , 白 盒 测试 为 辅 。 

(13) 黑 盒 测试 不 关心 模块 的 内 部 实现 方式 ,只 关心 其 功能 是 否 正确 ,通过 精心 设计 一 
些 测试 用 例 检 验 模 块 的 输入 和 输出 是 否 正确 来 判断 其 是 否 符合 预定 的 功能 要 求 。 

(14) Python 标准 库 unittest 提供 了 大 量 用 于 单元 测试 的 类 和 方法 。 

(15) 单元 测试 标准 库 unittest 中 TestCase 类 的 setUp() 和 tearDown() 方 法 分 别 在 每 
个 测试 之 前 和 之 后 自动 调用 ,常用 来 执行 数据 库 连接 的 创建 与 关闭 ,文件 的 打开 与 关闭 等 操 
NE ,避免 编写 过 多 的 重复 代码 。 

(16) 测试 用 例 以 及 测试 代码 的 设计 与 编写 也 可 能 会 存在 bug, 通 过 测试 并 不 代表 目标 
代码 没有 错误 ,但 是 一 般 而 言 ,不 能 通过 测试 的 模块 代码 是 存在 问题 的 。 

(17) 除了 功能 测试 ,还 应 对 程序 进行 性 能 测试 与 安全 性 测试 ,甚至 还 需要 进行 规范 性 
测试 以 保证 代码 可 读 性 和 可 维护 性 。 


习 题 


. Python 异常 处 理 结构 有 哪 几 种 形式 ? 

. 异常 和 错误 有 什么 区 别 ? 

. 使 用 pdb 模块 进行 Python 程序 调试 主要 有 哪 几 种 用 法 ? 
. Python 内 建 异 常 类 的 基 类 是 

.断言 语句 的 语法 为 

.Python 上 下 文 管理 语句 为 


on Ae wre 
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常用 GUI 工具 集 除 了 标准 库 tkinter, 还 有 功能 强大 的 wxPython, PyGObject, PyQt, 
PySide 等 ,或 者 也 可 以 利用 有 关 插 件 和 其 他 语言 混合 编程 以 便 充 分 利用 其 他 语言 的 GUI 界 
面 。 本 章 以 扩展 库 wxPython 和 标准 库 tkinter 为 例 来 介绍 Python 的 GUI 应 用 开发 。 


9.1 wxPython 


使 用 wxPython 创建 GUI 程序 的 三 个 主要 步骤 如 下 。 

(1) 导入 wxPython 包 。 

(2) 建立 框架 类 : 框架 类 的 父 类 为 wx. Frame, 在 框架 类 的 构造 函数 中 调用 父 类 的 构造 
函数 进行 初始 化 ,然后 为 frame 类 添加 各 种 控件 以 及 事件 处 理 方法 ,如果 需要 在 窗 体 上 增加 
其 他 控件 ,可 在 构造 函数 中 增加 有 关 代 码 , 如 需 处 理 相 应 事件 ,可 增加 框架 类 的 成 员 函 数 , 并 
将 其 与 相应 的 控件 绑 定 。 

(3) 建立 主 程序 : 通常 需要 做 4 件 事 , 创 建 应 用 程序 对 象 、 创 建 框架 类 对 象 . 显 示 框 架 、 
开始 事件 循环 。 执 行 frame. Show(True) 后 ,框架 才能 看 得 见 ,执行 app. MainLoop() 后 , 框 
架 才 能 接收 并 处 理事 件 。 

wxPython 提供 了 几乎 所 有 常用 的 控件 ,例如 按钮 .静态 文本 标签 ,文本 框 \ 单 选 钮 、 复 
选 框 对 话 框 、 菜 单 、 列 表 框 \ 树 形 控件 等 。 本 节 大 致 根据 控件 类 型 和 案例 需要 将 控件 进行 不 
同 的 组 合 , 而 不 是 孤零零 地 逐个 介绍 每 个 控件 的 属性 和 用 法 。 


9.1.1 Frame 


Frame 也 称 为 框架 或 窗 体 ,是 所 有 框架 的 父 类 ,也 是 包含 标题 栏 菜单 ,按钮 等 其 他 控件 
的 容器 ,运行 之 后 可 移动 缩放 。 

创建 GUI 程序 框架 时 ,需要 继承 wx. Frame 派生 出 子 类 ,在 派生 类 中 调用 基 类 构造 函 
数 进行 必要 的 初始 化 ,其 构造 函数 格式 为 


__init__ (self, Window parent, int id= - 1, String title= EmptyString， Point pos= 

DefaultPosition, Size size= DefaultSize, long style= DEFAULT FRAME STYLE, String name= 

FrameNameStr) 

各 参数 具体 含义 如 下 。 

(1) parent 一 一 框架 的 父 窗 体 。 该 值 为 None 时 表示 创建 顶级 窗 体 。 

(2) id 一 一 新 窗 体 的 wxPython ID 号 。 可 以 明确 地 传递 一 个 唯一 的 ID ,也 可 传递 一 1， 
这 时 wxPython 将 自动 生成 一 个 新 的 ID, 由 系统 来 保证 其 唯一 性 。 

(3) title 一 一 窗 体 的 标题 。 
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(4) pos 一 一 wx. Point 对 象 , 用 来 指定 新 窗 体 的 左上 角 在 屏幕 中 的 位 置 ,通常 (0, 0) 是 
显示 器 的 左上 角 坐 标 。 当 将 其 设 定 为 wx. DefaultPosition ,其 值 为 (一 1, 一 1) ,表示 让 系统 
决定 窗 体 的 位 置 。 

(5) size wx. Size 对 象 , 用 来 指定 新 窗 体 的 初始 大 小 。 当 将 其 设 定 为 wx. DefaultSize 
时 ,其 值 为 (一 1, 一 1) ,表示 由 系统 来 决定 窗 体 的 初始 大 小 。 

(6) style 一 一 指定 窗 体 类 型 的 常量 ,wx. Frame 的 常用 样式 如 表 9-1 所 示 。 对 一 个 窗 体 
控件 可 以 同时 使 用 多 个 样式 ,使 用 “位 或 "运算 符 “|” 连 接 即 可 。 比 如 wx. DEFAULT _ 
FRAME_STYLE 样式 就 是 由 以 下 几 个 基本 样式 的 组 合 : 


wx.MAXIMIZE BOX | wx.MINIMIZE BOX | wx.RESIZE BORDER | wx.SYSTEM MENU | wx.CAPTION | wx.CLOSE 
BOX 


要 从 一 个 组 合 样式 中 去 掉 个 别 的 样式 可 以 使 用 “^” 按 位 异 或 操作 符 , 例 如 ,要 创建 一 个 默认 
样式 的 窗 体 , 但 要 求 用 户 不 能 缩放 和 改变 窗 体 的 尺寸 ,可 以 使 用 这 样 的 组 合 : 


wx.DEFAULT_FRAME STYLE ^ (wx.RESIZE BORDER | wx.MAXIMIZE BOX | wx.MINIMIZE BOX) 


表 9-1 wx. Frame 常用 样式 


样 R 说 明 
wx.CAPTION 增加 标题 栏 
wx. DEFAULT_FRAME_STYLE | 默认 样式 
wx. CLOSE_BOX 标题 栏 上 显示 “关闭 ”按钮 
wx. MAXIMIZE_BOX 标题 栏 上 显示 “最 大 化 ”按钮 
wx. MINIMIZE_BOX 标题 栏 上 显示 “最 小 化 ”按钮 
wx. RESIZE_BORDER 边框 可 改变 尺寸 
wx. SIMPLE_BORDER 边框 没有 装饰 
wx. SYSTEM_MENU 增加 系统 菜单 (有 “关闭 ”“ 移 动 "“ 改 变 尺寸 "等 功能 ) 
wx FRAME_SHAPED 用 该 样式 创建 的 框架 可 以 使 用 SetShape() 方 法 来 创建 一 个 非 矩 形 
的 窗 体 
wx. FRAME_TOOL_WINDOW | 给 框架 一 个 比 正常 小 的 标题 栏 ,使 框架 看 起 来 像 一 个 工具 框 窗 体 


框架 的 名 字 ,指定 后 可 以 使 用 这 个 名 字 来 寻找 这 个 窗 体 。 
wx, Frame. init _() 方 法 只 有 参数 parent 没有 默认 值 , 最 简单 的 调用 方式 是 


(7) name 


wx.Frame. init (self, parent=None) 


这 将 生成 一 个 默认 位 置 . 默 认 大 小 .默认 标题 的 顶层 窗 体 。 

在 初始 化 窗 体 时 可 以 明确 给 构造 函数 传递 一 个 正 整 数 作为 新 窗 体 的 ID ,此 时 由 程序 员 
自己 来 保证 ID 不 重复 并 且 没有 与 预定 义 的 ID 号 冲突 ,例如 ,不 能 使 用 wx. ID_OK(5100)、 
wx. ID CANCEL(5101) wx. ID_ANY(—1) .wx.ID COPY(5032) .wx. ID APPLY(5102) 
等 预定 义 ID 号 对 应 的 数值 。 

如 果 无 法 确定 使 用 哪个 数值 作为 ID ,可 以 使 用 wx. NewId() 函数 来 生成 ID 号 ,这 样 就 
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可 以 避免 确保 ID 号 唯一 性 的 麻烦 。 


id=wx.NewId() 


frame=wx.Frame. init (None, id) 


当然 ,也 可 以 使 用 全 局 常量 wx. ID_ANY( 值 为 一 1) 来 让 wxPython 自动 生成 新 的 唯一 
ID 号 ,需要 时 可 以 使 用 GetId() 方 法 来 得 到 它 , 如 


frame=wx.Frame. init _ (None, -1) 


id= frame.GetId () 

本 节 最 后 通过 一 个 示例 演示 使 用 wxPython 创建 GUI 应 用 程序 的 思路 ,将 下 面 的 代码 
保存 并 运行 ,会 在 窗 体 上 的 文本 框 中 动态 显示 当前 窗 体 的 位 置 与 大 小 以 及 鼠标 相对 于 窗 体 
〈 即 窗 体 左 上 角 坐 标 为 (0,0)) 的 当前 位 置 ,可 以 移动 鼠标 并 观察 值 的 变化 。 


例 9-1 


wxPython GUI 框架 。 


import wx 
class MyFrame (wx.Frame) : 
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def init__(self, superior): 


wx.Frame. init _ (self, parent= superior, title=u'My First Form', 
size= (300, 300)) 

self.Bind(wx.EVT_SIZE, self.OnSize) 

self .Bind(wx.EVT_MOVE, self.OnFrameMove) 


#Add a panel and some controls to display the size and position 
panel=wx.Panel (self, -1) 

labell=wx.StaticText (panel, -1, "FrameSize:") 
label2=wx.StaticText (panel, -1, "FramePos:") 
label13=wx.StaticText (parent=panel, label="MousePos:") 
self.sizeFrame=wx.TextCtrl (panel, -1, "", style=wx.TE_READONLY) 
self .posFrame=wx.TextCtrl (panel, -1, "", style=wx.TE_READONLY) 
self .posMouse=wx.TextCtrl (panel, -1, "", style=wx.TE_READONLY) 
panel .Bind (wx.EVT_MOTION, self .OnMouseMove) # 绑 定 事 件 处 理 函 数 
self.panel=panel 


#Use some sizers for layout of the widgets 
sizer=wx.FlexGridSizer (3, 2, 5, 5) 

sizer .Add(label1) 
sizer.Add(self.sizeFrame) 
sizer .Add (label2) 
sizer.Add(self.posFrame) 
sizer .Add (label3) 
sizer.Add (self .posMouse) 


border=wx.BoxSizer () 
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border.Add (sizer, 0, wx.ALL, 15) 
panel.SetSizerAndFit (border) 


self.Fit() 


def onsize (self, event) : 


size=event.GetSize () 


self.sizeFrame.SetValue ("%s, %s" %(size.width, size.height)) 


#tell the event system to continue looking for an event handler, 
#so the default handler will get called. 
event.Skip () 


def OnFrameMove (self, event): 


pos= event .GetPosition () 


self.posFrame.SetValue("%s, %s" %(pos.x, pos.y)) 
def OnMouseMove (self, event) : # 鼠 标 移动 事件 处 理 函 数 
pos= event .GetPosition () 


self .posMouse.SetValue ("%s, %s" %(pos.x, pos.y)) 


if name =='_ main_': 


app=wx.App()#Create an instance of the application class 


frame=MyFrame (None) 
frame. Show (True) E] My First Form [a [E] 
app.MainLoop () #Tell it to start processing events FrameSize: 226, 153 


运行 结果 如 图 9-1 所 示 , 改 变 窗 体位 置 和 大 小 时 ,文本 框 内 FromePos 586 284 
的 数值 会 动态 变化 , 当 鼠 标 在 窗 体内 移动 时 ,文本 框 内 实时 显 “e295 


示 鼠 标 当 前 坐标 , 当 鼠 标 移 动 到 窗 体 之 外 时 ,文本 框 中 的 数值 


将 不 再 变化 。 


图 9-1 显示 窗 体 大 小 和 位 置 
以 及 鼠标 位 置 


9.1.2 Button StaticText TextCtrl 


按钮 主要 用 来 响应 用 户 的 单 击 操作 ,按钮 上 面 的 文本 一 般 是 创建 时 直接 指定 的 ,很 少 需 
要 修改 。 当 然 , 如果 确 实 需 要 动态 修改 ,可 以 通过 SetLabelText() 方 法 来 实现 ,再 结合 
GetLabelText() 方 法 来 获取 按钮 控件 上 面 显 示 的 文本 , 则 可 以 实现 同一 个 按钮 完成 不 同 功 
能 。 为 按钮 绑 定 事件 处 理 函 数 的 方法 为 


Bind(event, handler, source=None, id=-1, id2=-1) 


静态 文本 控件 主要 用 来 显示 文本 或 给 用 户 操作 提示 ,不 用 来 响应 用 户 单 击 或 双击 事件 ， 


需要 时 可 以 使 


日 SetLabel() 方 法 动态 为 StaticText 控件 设置 文本 。 


文本 框 主要 用 来 接收 用 户 的 文本 输入 ,可 以 使 用 GetValue() 方 法 获取 文本 框 中 输入 的 
内 容 , 也 可 以 使 用 SetValue() 方 法 设置 文本 框 中 的 文本 。 下 面 通过 一 个 示例 来 演示 这 三 个 
控件 的 用 法 ,将 下 面 的 代码 保存 为 wxIsPrime. py, 运 行 后 用 户 输入 一 个 整数 , 单 击 按钮 后 判 
断 是 否 为 素数 并 输出 结果 。 
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例 9-2 素数 判断 的 GUI 程序 。 


import wx 
from math import sqrt 


class IsPrimeFrame (wx.Frame) : 
def init (self, superion): 
wx.Frame. init (self, parent=superion, title= 'Check Prime', 
size= (400, 200)) 
panel=wx.Panel (self) 
panel . SetBackgroundColour ("Yellow") # 设 置 窗 体 背 景 颜色 
wx.StaticText (parent=panel, label= 'Input a integer:', pos= (10, 10)) 
# 添 加 静态 文本 控件 
self.inputN= wx.TextCtrl (parent=panel, pos= (120, 10)) ”# 添 加 文本 框 
self.result=wx.StaticText (parent=panel, label='', pos= (10, 50)) 
self .buttonCheck= wx.Button (parent=panel, label= 'Check', pos= (70, 90)) 
# 添 加 按钮 
# 为 按钮 绑 定 事件 处 理 方法 
self.Bind(wx.EVT_BUTTON, self.OnButtonCheck, self.buttonCheck) 
self .buttonQuit=wx.Button (parent=panel, label= 'Quit', pos= (150, 90)) 
self.Bind(wx.EVT_BUTTON, self.OnButtonQuit, self.buttonQuit) 


def OnButtonCheck (self, event): 
self.result .SetLabel ('') 
try: 
num= int (self. inputN.GetValue () ) # 获 取 用 户 输入 的 数字 
except BaseException, e: 
self.result.SetLabel ("not a integer") 
return 


n= int (sqrt (num) ) 


for i in range(2, n+1): PIKAP A SF J BL 
if num3i==0: 
self.result .SetLabel ('No') # 使 用 静态 文本 框 显 示 结 果 
break 
else: 


self.result.SetLabel('Yes') 


def OnButtonQuit (self, event): 
dig=wx.MessageDialog(self, "Really Quit?', 'Caution',\ 
wx.CANCEL | wx.OK|wx.ICON_QUESTION) 
if dlg.ShowModal ()==wx.ID_OK: 
self .Destroy () 


_name ==" main ': 
app= wx -App () 
frame=IsPrimeFrame (None) 


frame-Show () 
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app-MainLoop () 
运行 结果 如 图 9-2 所 示 。 


M Check Prize 


Input a integer: 


图 9-2 素数 判断 


9.1.3 Menu 


菜单 可 以 分 为 普通 菜单 和 弹出 式 菜单 两 大 类 ,其 中 普通 菜单 也 就 是 大 多 数 窗 口 菜单 栏 
的 下 拉 菜 单 , 弹 出 式 菜单 也 称 上 下 文 菜单 ,一 般 需 要 使 用 鼠标 右键 激活 ,并 根据 不 同 的 环境 
或 上 下 文 来 显示 不 同 的 菜单 项 。 下 面 对 这 两 类 菜单 分 别 进行 介绍 。 

1. 创建 普通 菜单 


self.frame= wx.Frame (parent=None，title= 'wxGUI'，size= (640, 480)) 


self.panel=wx.Panel (self.frame, - 1) 


self .menuBar=wx.MenuBar () # 创 建 菜单 栏 
self.menu= wx.Menu () # 创 建 菜单 
self .menuOpen= self .menu.Append (101, 'Open') # 创 建 菜 单项 


self .menuSave= self .menu.Append (102, 'Save') 
self .menuSaveAs= self .menu.Append (103, 'Save As') 


self .menu.AppendSeparator () # 分 隔 符 
self.menuClose= self .menu.Append (104, 'Close') 
self .menuBar.Append(self.menu, '&File') # 将 菜单 添加 至 菜单 栏 


self .menu= wx .Menu () 

self.menuCopy= self .menu.Append(201, 'Copy') 
self.menuCut= self.menu.Append (202, 'Cut') 
self .menuPaste= self.menu.Append (203, 'Paste') 
self.menuBar .Append (self .menu, '&Edit') 


创建 菜单 完成 之 后 ,通过 下 面 的 代码 将 创建 的 菜单 设置 为 窗 体 菜单 。 
self.frame.SetMenuBar (self.menuBar) 


2. 创建 弹出 式 菜单 


self.popupMenu= wx.Menu () # 创 建 菜单 
self .popupCopy= self .popupMenu.Append (901, 'Copy') # 创 建 菜单 项 
self .popupCut= self .popupMenu Append (902, 'Cut') 

self .popupPaste= self .popupMenu.Append (903, 'Paste') 


接 下 来 为 窗 体 绑 定 鼠 标 右键 单 击 操作 : 


self .Bind (wx.EVT RIGHT DOWN, self.OnRClick) 
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然后 编写 右键 单 击 处 理 函 数 ,用 户 右 击 时 弹出 上 面 定义 的 弹出 式 菜单 。 


def OnRClick(self, event): 
pos= (event.GetX(), event .Get¥()) # 获 取 鼠 标 当 前 位 置 
self.panel.PopupMenu(self.popupMenu, pos) 。” # 在 鼠标 当前 位 置 弹出 上 下 文 菜单 


3. 为 菜单 项 绑 定 单 击 事件 处 理 函 数 
对 于 普通 下 拉 式 菜单 和 弹出 式 菜单 ,为 菜单 项 绑 定 事件 处 理 函 数 的 方式 是 一 样 的 ， 


例如 下 面 的 代码 ,其 中 第 二 个 数值 型 的 参数 是 菜单 项 的 ID, 最 后 一 个 参数 是 事件 处 理 
函数 的 名 称 。 绑 定之 后 ,运行 程序 并 单 击 某 菜单 项 , 则 会 执行 相应 的 事件 处 理 函 数 中 
的 代码 。 


Wx.EVT MENU (self, 102, self.OnOpen) 
wX.EVT_MENU (self, 103, self.OnSave) 
wX.EVT_MENU (self, 104, self.OnSaveAs) 
wX.EVT_MENU (self, 105, self.OnClose) 


4. 编写 菜单 项 的 单 击 事件 处 理 函 数 
具体 的 事件 处 理 函 数 根据 不 同 的 业务 迎 辑 有 所 不 同 , 这 里 仅 演 示 如 何在 状态 栏 上 显示 


一 段 文本 ,有 关 状 态 栏 的 介绍 请 参考 9. 1.4 节 。 


def OnNew(self, event): 
self.statusBar.SetStatusText ("You clicked the New menu.') 


9.1.4 ToolBar ,StatusBar 


工具 栏 往往 用 来 显示 当前 上 下 文 最 常用 的 功能 按钮 ,一般 而 言 ,工具 栏 按钮 是 菜单 全 前 


功能 的 子 集 。 状 态 栏 主要 用 来 显示 当前 状态 或 给 用 户 友 好 提示 ,例如 , Word 软件 中 的 状态 
栏 上 显示 的 当前 页 码 、 总 页 数 、 节 数 以 及 当前 行 与 当前 列 等 信息 。 


1. 创建 工具 栏 


self .toolbar= self.frame.CreateToolBar () 
接 下 来 在 工具 栏 添加 工具 ,相应 的 工具 栏 图 片 需要 提前 准备 好 ,并 存放 于 当前 目录 下 。 


Self.toolbar. AddSimpleTool (9999, wx. Image ("open.png', wx.BITMAP TYPE PNG) .ConvertToBitmap 
(), "Open", 'Click to Open a file") 


然后 使 用 下 面 的 代码 准备 工具 栏 使 其 有 效 。 
self.toolbar.Realize() 


最 后 绑 定 事件 处 理 函数 ,事件 处 理 函 数 的 编写 与 前 面 介绍 的 按钮 .菜单 项 等 控件 的 事件 


处 理 函数 一 样 ,此 处 不 再 蓉 述 。 
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wx.EVT_TOOL (self, 9999, self.OnOpen) 


2. 创建 状态 栏 
状态 栏 的 创建 和 使 用 相对 比较 简单 ,通过 下 面 的 代码 即 可 创建 : 
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self.statusBar=self.frame.CreateStatusBar () 


如 果 需 要 在 状态 栏 上 显示 状态 或 者 显示 文本 以 提示 用 户 , 可 以 通过 下 面 的 代码 设置 状 
态 栏 文本 : 


self.statusBar.SetStatusText ("You clicked the Open menu.') 
9.1.5 对话 框 


wxPython 提供 了 一 整套 预定 义 对 话 框 支持 友好 界面 开发 ,常用 的 有 : 
(1) MessageBox 一 一 简单 消息 框 。 


(2) GetTextFromUser 接收 用 户 输入 的 文本 。 
(3) GetPasswordFromUser 接收 用 户 输入 的 密码 。 
(4) GetNumberFromUser 接收 用 户 输入 的 数字 。 


(5) FileDialog 一 一 文件 对 话 框 。 

(6) FontDialog 一 一 字体 对 话 框 。 

(7) ColourDialog 一 一 颜色 对 话 框 。 

除 用 于 信息 提示 的 简单 消息 框 之 外 ,其 他 几 种 对 话 框 的 使 用 都 遵循 固定 的 步骤 : 首先 
创建 对 话 框 ,然后 显示 对 话 框 , 最 后 根据 对 话 框 的 返回 值 采取 不 同 的 操作 。 下 面 的 代码 演示 
了 MessageBox 用 法 ,完整 代码 可 以 参照 9. 1. 6 节 的 示例 。 


wx.MessageBox (finalStr) 


下 面 的 代码 演示 了 MessageDialog 用 法 .完整 代码 请 参考 9.1.2 节 。 其 他 对 话 框 可 以 
参考 MessageDialog 对 话 框 的 用 法 。 


def OnButtonQuit (self, event): 
dlg=wx.MessageDialog (self, 'Really Quit?', 'Caution', 
wx.CANCEL|wx.OK| wx.ICON QUESTION) 
if dlg.ShowModal ()==wx.ID_OK: 
self.Destroy() 


下 面 的 代码 则 在 IDLE 交互 式 模式 下 演示 了 颜色 对 话 框 的 用 法 : 


>>> import wx 

>>> app=wx.App() 

>>> dlg= wx.ColourDialog (None) 

>>> dlg.ShowModal () 

5100 

>>> c=dlg.GetColourData () 

>>> c 

<wx. _ windows. ColourData; proxy of < Swig Object of type 'wxColourData * ' at 
0x2df84c0> > 

>>> c.Colour 


wx.Colour (255, 0, 0, 255) 
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9.1.6 RadioButton ,CheckBox 


单 选 按钮 常用 来 实现 用 户 在 多 个 选项 中 的 互 斥 选择 ,在 同一 组 内 多 个 选项 中 只 能 选择 
一 个 ,当选 择 发 生变 化 之 后 ,之 前 选中 的 选项 自动 失效 。 复 选 框 往往 用 来 实现 非 互 斥 多 选 的 
功能 ,多 个 复 选 框 之 间 的 选择 互 不 影响 。 

可 以 使 用 wxPython 的 SashWindow 控件 对 单 选 按钮 进行 分 组 ,也 可 以 使 用 单 选 按钮 
控件 的 样式 进行 分 组 ,每 组 的 第 一 个 单 选 按钮 使 用 wx. RB_GROUP 样式 ,其 他 单 选 按钮 不 
使 用 该 样式 。 

单 选 按钮 和 复 选 框 的 很 多 操作 是 通用 的 。 可 以 使 用 GetValue() 方 法 判断 单 选 按钮 或 
复 选 框 是 否 被 选中 ,使 用 Set Value (True) 将 单 选 按钮 或 复 选 框 设置 为 选中 状态 ,使 用 
SetValue(False) 将 单 选 按钮 或 复 选 框 设置 为 未 选中 状态 。 

在 某 些 应 用 中 ,可 能 需要 响应 单 选 按钮 、 复 选 框 的 鼠标 单 击 事件 ,根据 不 同 的 需要 可 以 
使 用 wx. EVT_RADIOBOX() 、wx. EVT_CHECKBOX() 分 别 为 单 选 按钮 , 复 选 框 来 绑 定 
事件 处 理 函数 。 

例 9-3 wxPython 单 选 钮 与 复 选 框 的 用 法 。 


import wx 
class wxGUI (wx.App) : 
def OnInit (self): 
self. frame=wx.Frame (parent=None, title= 'wxGUI', size= (300, 280)) 


self.panel=wx.Panel (self.frame, - 1) 


self.radioButtonSexM= wx .RadioButton (self.panel, -1, 'Male', pos= (80, 60)) 

self. radioButtonSexF= wx.RadioButton (self.panel, -1, 'Female', pos= (80, 80)) 

self. checkBoxAdmin= wx. CheckBox (self. panel, - 1, 'Aministrator', pos= 
(150, 80)) 


self. labell= wx. StaticText (self.panel, - 1, 'UserName:', pos= (0, 110), style=wx. 
ALIGN_RIGHT) 

self. label2= wx. StaticText (self.panel, - 1, 'Password:', pos= (0, 130), style=wx. 
ALIGN_RIGHT) 


self.textName=wx.TextCtrl(self.panel, -1, pos= (70, 110), size= (160, 20)) 
self.textPwd=wx.TextCtrl (self.panel, - 1, pos= (70, 130), size= (160, 20), style=wx. 
TE_PASSWORD) 


self.buttonOK=wx.Button(self.panel, -1, 'OK', pos= (30, 160)) 
self.Bind (wx.EVT BUTTON, self.OnButtonOK, self.buttonOK) 

self .buttonCancel=wx.Button(self-panel, -1, 'Cancel', pos= (120, 160)) 
self.Bind (wx.EVT BUTTON, self.OnButtonCancel, self .buttonCancel) 
self.buttonOK.SetDefault () 


self. frame.Show() 
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return True 


def OnButtonOK (self, event): 
finalstr='"' 
if self£.radioButtonSexM.GetValue ()==True: 
finalstr+='Sex:Male\n' 
elif self .radioButtonSexF .GetValue ()== True: 
finalstr+='Sex:Female\n' 
if self.checkBoxAdmin.GetValue ()==True: 
finalstr+='Administrator\n' 
if self.textName.GetValue()== 'dongfuguo" and self.textPwd. 
GetValue ()== "dongfuguo ' : 
finalStr+='user name and password are correct\n' 
else: 
finalStr+='user name or password is incorrect\n' 
wx .MessageBox (finalStr) 
def OnButtonCancel (self, event): 
self.radioButtonSexM. SetValue (True) 
self.radioButtonSexF.SetValue (False) 


self.checkBoxAdmin.SetValue (True) D 
self.textName.SetValue ('') 
@ Male 
self.textPwd.SetValue('') © Female PlAministrator 
UserName: 
app= wxGUI () Password: 


app.MainLoop () [C ok J cancel 
上 面 的 代码 运行 结果 如 图 9-3 所 示 ,选择 单 选 按钮 、 
复 选 框 并 输入 文本 框 中 要 求 的 用 户 名 和 密码 之 后 单 击 图 9-3 单 选 按钮 、 复 选 框 的 用 法 演示 
OK 按钮 会 弹出 消息 框 提示 输入 和 选择 的 内 容 , 单 击 
Cancel 按钮 自动 清除 用 户 的 输入 ,并 默认 将 单 选 按钮 Male 设置 为 选中 状态 。 


9.1.7 ComboBox 


组 合 框 用 来 实现 从 固定 的 多 个 选项 中 选择 其 中 一 个 的 操作 ,外 观 与 文本 框 类 似 ,但 是 单 击 
下 拉 箭 头 时 弹出 所 有 可 选项 , 极 大 地 方便 了 用 户 的 操作 ,并且 在 窗 体 上 不 占用 太 大 的 空间 。 

如 果 需 要 响应 和 处 理 组 合 框 的 鼠标 单 击 事件 ,可 以 使 用 wx. EVT_COMBOBOX() 为 组 
合 框 绑 定 事件 处 理 函 数 。 

例 9-4 wxPython 组 合 框 联动 。 


import wx 
class wxGUI (wx.App) : 
def OnInit (self) : 
self.frame=wx.Frame (parent=None, title= 'wxGUI', size= (300, 200)) 


self.panel=wx.Panel (self. frame, —1) 
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self.names={'First Class':['Zhang San', 'Li Si', ‘Wang Wu'], 
"Second Class':['Zhao Liu', "Zhou Qi']} 


#ComboBox1 

self .comboBox1=wx .ComboBox (self.panel, value= 'Click here',\ 
choices= self .names.keys(),\ 
pos= (0, 50), size= (100, 30)) 

self.Bind (wx.EVT_COMBOBOX, self.OnCombol, self.comboBox1) 


#ComboBox2 
self .comboBox2= wx .ComboBox (self .panel, value= 'Click here',\ 
choices= [],\ 
pos= (0, 100), size= (100, 30)) 
self .Bind (wx.EVT_COMBOBOX, self.OnCombo2, self.comboBox2) 


self. frame .Show() 


return True 


def OnCombol (self, event): 
banji=self.comboBox1 .GetValue () 
self .comboBox2.Set (self.names [banji]) # 动 态 修改 第 二 个 组 合 框 中 显示 的 选项 


def OnCombo2 (self, event): 
wx .MessageBox (self .comboBox2.GetValue () ) 


app= wxGUI () 
app .MainLoop () 


wu Slee) 


程序 运行 后 ,界面 如 图 9-4 所 示 ,首先 在 第 一 个 组 合 FirstClass 
框 中 选择 班级 ,然后 第 二 个 组 合 框 中 自动 列 出 该 班级 的 Wang wee 
同学 姓名 , 选择 同学 姓名 后 弹出 消息 框 显示 选择 的 
姓名 。 


9.1.8 ListBox 


列表 框 用 来 放置 多 个 元 素 提 供给 用 户 进 行 选 择 ,其 中 每 个 元 素 都 是 字符 串 ,支持 用 户 单 
选 和 多 选 。 列 表 框 的 样式 和 常用 方法 如 表 9-2 和 表 9-3 所 示 。 
表 9-2 列表 框 常用 样式 


图 9-4 ”组合 框 联动 演示 


样 R 说 明 
wx. LB_EXTENDED 可 以 使 用 Shift 键 和 鼠标 配合 选择 连续 多 个 元 素 
wx. LB_MULTIPLE 可 以 选择 多 个 不 连续 的 元 素 
wx. LB_SINGLE 最 多 只 能 选择 一 个 元 素 
wx. LB_ALWAYS_SB 始终 显示 一 个 垂直 滚动 条 
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续 表 
样 R 说 明 
wx. LB_HSCROLL 仅 在 需要 时 显示 一 个 垂直 滚动 条 
wx. LB_SORT 列表 框 中 的 元 素 按 字母 顺序 排序 
表 9-3 列表 框 常用 方法 
样 R 说 明 

Append(string) 在 列表 框 尾部 增加 一 个 元 素 
Clear() 删除 列表 框 中 所 有 元 素 
Delete(index) 删除 列表 框 指定 索引 的 元 素 
FindString(string) 返回 指定 元 素 的 索引 , 若 没 找到 , 则 返回 一 1 
GetCount() 返回 列表 框 中 元 素 的 个 数 
GetSelection() 返回 当前 选择 项 的 索引 , 仅 对 单 选 列表 框 有 效 
SetSelection(index,True/False) 设置 指定 索引 的 元 素 的 选择 状态 
GetStringSelection() 返回 当前 选择 的 元 素 , 仅 对 单 选 列表 框 有 效 
GetString(index) 返回 指定 索引 的 元 素 
SetString(index, string) 设置 指定 索引 的 元 素 文本 
GetSelections() 返回 包含 所 选 元 素 的 元 组 
InsertItems(items, pos) 在 指定 位 置 之 前 插入 元 素 
IsSelected(index) 返回 指定 索引 的 元 素 的 选择 状态 
Set(choices) 使 用 列表 choices 的 内 容重 新 设置 列表 框 


下 面 的 代码 演示 了 列表 框 的 用 法 ,运行 程序 后 ,列表 框 中 显示 周 日 到 周 六 的 每 天 ,用 户 
单 击 其 中 一 个 后 弹出 一 个 消息 框 来 提示 所 选择 的 内 容 , 单 击 Quit 按钮 时 弹出 关闭 前 的 确认 
例 9-5 wxPython 列表 框 应 用 。 


import wx 


class ListBoxDemo (wx .Frame) : 
def init__(self, superion): 

wx.Frame. init (self, parent=superion, title= "ListBox demo', size= 
(200, 200)) 

panel=wx. Panel (self) 

self .buttonQuit=wx.Button (parent=panel, label= 'Quit', pos= (60, 120)) 

self.Bind (wx.EVT BUTTON, self.OnButtonQuit, self.buttonQuit) 

li= ['Sunday', 'Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', ' 

Saturday" ] 
self. listBox=wx.ListBox (panel, choices=1i) # 创 建 列表 框 
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self.Bind(wx.EVT_LISTBOX, self.OnClick, self.listBox) 


HIE RAFAH RR 


def OnClick (self, event): 
#t=self.listBox.GetSelection () 
#s=self.listBox.GetString (t) 
s=self.listBox.GetStringSelection () 
wx.MessageBox (s) 


def OnButtonQuit (self, event): 
dlg=wx.MessageDialog (self, 'Really Quit?', 'Caution',\ 
wx.CANCEL | wx.OK| wx. ICON_QUESTION) 
if dlg.ShowModal ()==wx.ID_OK: 
self .Destroy() 
if name ==" main_': 
app= wx.App () 
frame= ListBoxDemo (None) 


MM ListBox deao |. | 口 |X 


frame .Show() 
app .MainLoop () 


运行 结果 如 图 9-5 所 示 。 


9.1.9 TreeCtrl 图 9-5 列表 框 用 法 


树 形 控件 常用 来 显示 有 严格 层次 关系 的 数据 ,可 以 非常 
清晰 地 表示 各 元 素 之 间 的 从 属 关系 或 层级 关系 ,比如 Windows 资源 管理 器 左 侧 窗口 ( 见 
图 9-6) 以 及 注册 表 编 辑 器 ( 见 图 9-7) 。 


HN Q4orhtm 
a & system (C) © 401-Lhtm 
a Qi inetpub © 401-2htm 
< custerr © 401-3.htm 
i zh-CN © 401-4.htm 
W history © 401-5.htm ?加 HKEY_CLASSES ROOT || a ERN 
b Ji logs © 403.htm ?- 国 HKEY_CURRENT_USER 
图 temp © 403-Lhtm 4) HKEY LOCAL MACHINE 
e 和 403-2htm >i BCD00000000 
Toe © 403-3.htm 》- 国 HARDWARE 
© 403-4.htm »-J SAM 
b k Pan S pe @ 403-5him J secur 
es © 403-6htm >) SOFTWARE 
> i ProgramData O 403-7htm > jo SYSTEM 
b ib Python27 © 403-8.htm ?- 国 HKEY_USERS 
> UB python34 © 403.9.htm b- HKEY_CURRENT_CONFIG 
b È python35 E 403-10.htm 
图 9-6 资源 管理 器 界面 9-7 注册 表 编 辑 器 界面 


树 形 控件 的 常用 方法 和 事件 分 别 如 表 9-4 和 表 9-5 所 示 。 
下 面 的 代码 演示 了 树 形 控件 的 用 法 ,这 个 简单 的 示例 演示 了 增加 根 节 点 、 增 加 子 节点 、 
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表 9-4 树 形 控件 常用 方法 
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方 法 


说 明 


root= tree. AddRoot(string) 


增加 根 节点 ,返回 根 节点 ID 


child= tree. AppendItem(item, string) 


为 指定 节点 增加 下 级 节点 ,返回 新 节点 ID 


SetItemText(item, string) 设置 节点 文本 

GetItemText() 返回 节点 文本 
SetItemPyData(item,obj) 设置 节点 数据 
GetItemPyData(item) 返回 指定 节点 的 数据 
Expand(item) 展开 指定 节点 ,但 不 展开 下 级 节点 
ExpandAll() 展开 所 有 节点 

Collapse(item) 收 起 指定 节点 
CollapseAndReset() 收 起 指定 节点 并 删除 其 下 级 节点 
GetRootltem() 返回 根 节 点 ID 

(childID, cookie) =GetFirstChild (item) 返回 指定 节点 的 第 一 个 子 节点 
flag= child. IsOkO 测试 节点 ID 是 否 有 效 


Citem, cookie) =GetNextChild (item, cookie) 


返回 同 级 的 下 一 个 节点 


GetLastChild(item) 


返回 指定 节点 的 最 后 一 个 子 节点 


GetPrevSibling(item) 


返回 同 级 的 上 一 个 节点 


GetItemParent(item) 返回 指定 节点 的 父 节点 ID 
ItemHasChildren(item) 测试 节点 是 否 有 下 级 节点 
SetItemHasChildren(item, True) 将 指定 节点 设置 为 有 下 级 节点 的 状态 
GetSelection() 返回 单 选 树 中 当前 被 选中 节点 的 ID 
GetSelections() 返回 多 选 树 中 所 有 被 选中 节点 ID 的 列表 
SelectItem(item, True/False) 改变 节点 的 选择 状态 

IsSelected(item) 测试 节点 是 否 被 选中 

Delete(item) 删除 指定 ID 的 节点 

DeleteAllltems() 删除 所 有 节点 

DeleteChildren(item) 删除 指定 ID 的 节点 所 有 下 级 节点 
InsertItem( parent. idPrevious. text) 在 指定 节点 后 面 插入 节点 
InsertItemBefore( parent, index, text) 在 指定 位 置 之 前 插入 节点 


217 


Python 程序 设 


RS 树 形 控件 常用 事件 


事 件 说 明 
wx, EVT_TREE_SEL_CHANGING 控件 发 生 选 择 变化 之 前 触发 该 事件 
wx, EVT_TREE_SEL_CHANGED 控件 发 生 选 择 变化 之 后 触发 该 事件 
wx. EVT_TREE_ITEM_COLLAPSING 收 起 一 个 节点 之 前 触发 该 事件 
wx. EVT_TREE_ITEM_COLLAPSED 收 起 一 个 节点 之 后 触发 该 事件 
wx. EVT_TREE_ITEM_EXPANDING 展开 一 个 节点 之 前 触发 该 事件 
wx. EVT_TREE_ITEM_EXPANDED 展开 一 个 节点 之 后 触发 该 事件 


例 9-6 wxPythor 树 形 控件 应 用 。 


import wx 


class TreeCtrlFrame (wx.Frame) : 
def init__(self, superion): 
wx.Frame. init__(self, parent=superion, title= "TreeCtrl demo', 
size= (300, 400)) 

panel=wx. Panel (self) 

self.tree=wx.TreeCtrl1 (parent=panel, pos= (5, 5), size= (120, 200)) 

self.inputString=wx.TextCtrl (parent=panel, pos= (150, 10)) 

self. buttonAddChild= wx. Button (parent= panel, label= 'AddChild', pos= 
(150, 90)) 

self.Bind (wx.EVT_BUTTON, self.OnButtonAddchild, self .buttonAddChild) 

self. buttonDeleteNode= wx. Button (parent= panel, label= 'DeleteNode', pos 

= (150, 120)) 

self.Bind (wx.EVT_BUTTON, self.OnButtonDeleteNode, self .buttonDeleteNode) 

self. buttonAddRoot= wx. Button (parent= panel, label= ' AddRoot', pos= 
(150, 150)) 

self .Bind(wx.EVT_BUTTON, self.OnButtonAddRoot, self .buttonAddRoot) 


def OnButtonAddChild (self, event): 
itemSelected= self.tree.GetSelection () 
if not itemSelected: 
wx .MessageBox ("Select a Node first.') 
return 
itemString=self.inputString.GetValue() 
self.tree.AppendItem(itemSelected, itemString) 


def OnButtonDeleteNode (self, event) : 
itemSelected= self .tree.GetSelection () 
if not itemSelected: 
wx.MessageBox ("Select a Node first.') 


return 
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self.tree.Delete (itemSelected) 


def OnButtonAddRoot (self, event): 
rootItem= self.tree.GetRoot Item () 
if rootItem: 
wx-MessageBox ("The tree has already a root. ') 
else: 
itemString= self. inputString.GetValue () 
self.tree.AddRoot (itemString) 


if_ name =='_main ': 
app=wx.App () 
frame= TreeCtrlFrame (None) 
frame.Show () rr 
app-MainLocp () DeleteNode 
运行 结果 如 图 9-8 所 示 , 界 面 中 的 文本 框 用 来 输入 
节点 显示 的 文本 ,首先 单 击 AddRoot 按钮 插入 根 节 点 ， 
然后 单 击 选中 根 节 点 ,再 单 击 AddChild 按钮 插入 子 节 图 9-8 树 形 控件 用 法 


点 ,最 后 单 击 选 中 某 个 子 节点 再 单 击 AddChild 按钮 为 
其 插入 子 节点 。 如 果 单 击 选 中 某 个 子 节点 后 单 击 DeleteNode 按钮 则 可 以 删除 该 节点 。 


9.2 tkinter 应 用 案例 精 选 


Python 标准 库 tkinter 是 对 Tcl/Tk 的 进一步 封装 ,与 tkinter. ttk 和 tkinter. tix 共同 提 
供 了 强大 的 跨 平台 GUI 编程 的 功能 ,IDLE 就 是 使 用 tkinter 开发 的 。 本 节 通 过 几 个 案例 介 
44 tkinter 库 中 部 分 组 件 的 用 法 。 


9.2.1 用 户 登录 界面 


用 户 登 录 界 面 几乎 无 处 不 在 ,用 户 输入 用 户 名 /账号 和 密码 之 后 ,系统 进行 验证 ,通过 验 
证 才 可 以 进行 后 续 的 操作 。 一 般 而 言 ,用 户 密码 都 是 经 过 安全 哈 希 算法 加 密 之 后 存储 到 数 
据 库 中 的 ,并 不 直接 保存 明文 。 

例 9-7 tkinter 实现 用 户 登 录 界 面 。 

本 例 主 要 演示 如 何 使 用 tkinter 创建 应 用 程序 窗口 ,以 及 文本 框 \ 按 钮 和 简单 消息 框 等 
组 件 的 用 法 。 


import tkinter 
import tkinter .messagebox 


def login(): # 登 录 按 钮 事件 处 理 函 数 
name= entryName .get () # 获 取 用 户 名 
pwd=entryPwd.get () # 获 取 密 码 


if name=='admin' and pwd== '123456': 
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tkinter.messagebox.showinfo (title= 'Python tkinter', message= 'OK') 
else: 


tkinter .messagebox.showerror ('Python tkinter', message= 'Error') 


def cancel () : 
vaxrName.set ("") # 清 空 用 户 输入 的 用 户 名 和 密码 


varPwd.set ('') 


root=tkinter.Tk() 
varName=tkinter.StringVar (value= '') 


varPwd= tkinter.StringVar (value= '') 


labelName= tkinter.Label (root, text= "User Name:', # 创 建 标签 
justify=tkinter.RIGHT, width= 80) 

labelName.place (x= 10, y=5, width=80, height=20) # 将 标签 放 到 窗口 上 

entryName=tkinter.Entry (root, width=80, # 创 建文 本 框 


textvariable= varName) # 同 时 设置 关联 的 变量 
entryName.place (x=100, y=5, width= 80, height=20) 
labelPwd= tkinter.Label (root, text= 'User Pwd:', justify=tkinter.RIGHT, width= 80) 
labelPwd.place (x=10, y=30, width=80, height=20) 
entryPwd= tkinter.Entry (root, show='* ', # 创 建 密码 文本 框 
width= 80, textvariable=varPwd) 
entryPwd.place (x= 100, y= 30, width= 80, height=20) 
buttonOk=tkinter.Button (root, text= 'Login', # 创 建 按钮 组 件 
command= login) # 同 时 设置 按钮 事件 处 理 函 数 
buttonOk.place (x= 30, y=70, width=50, height=20) 
buttonCancel=tkinter.Button (root, text= 'Cancel', command= cancel) 
buttonCancel .place (x= 90, y=70, width=50, height=20) 


root .mainloop () # 启 动 消息 循环 
将 上 面 的 代码 保存 为 tkinter_login. pyw, 运 行 结果 如 图 9-9 所 示 ,如 果 用 户 输入 用 户 名 


admin 和 密码 123456 并 单 击 Login 按钮 ,弹出 密码 正确 对 话 框 ( 见 图 9-10) ,否则 弹出 密码 
错误 对 话 框 ( 见 图 9-11)。 单 击 Cancel 按钮 可 以 清空 已 输入 的 用 户 名 和 密码 。 


Ve Sey 
User Name: ok 
一 一 9 
Login | Cancel = 
图 9-9 用 户 登 录 界 面 图 9-10 ”密码 正确 图 9-11 密码 错误 


9.2.2 选择 类 组 件 应 用 
下 面 的 案例 创建 了 一 个 包含 文本 框 、 单 选 钮 、 复 选 框 、 组 合 框 按钮 和 列表 框 等 组 件 的 GUI 
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应 用 程序 ,运行 后 输入 学 生 姓 名 并 选择 年 级 、 班 级 ,性 别 以 及 是 否 班长 等 信息 后 , 单 击 Add 
按钮 可 将 该 学 生 信息 添加 到 列表 框 中 。 在 列表 框 中 选择 一 项 后 单 击 DeleteSelection 按钮 可 
将 其 从 列表 框 中 删除 ,没有 选择 任何 项 而 直接 单 击 该 按钮 则 提示 No Selection。 

例 9-8 tkinter 单 选 钮 . 复 选 框 .组 合 框 列 表 框 综合 运用 案例 。 


import tkinter 
import tkinter .messagebox 
import tkinter.ttk 


root=tkinter.Tk() 


root.title('Selection widgets---by Dong Fuguo') # 窗 口 标题 

root ["height']= 400 # 定 义 窗 口 大 小 

root['width']=320 

labelName= tkinter.Label (root, text= 'Name:', 创建 标签 
justify=tkinter.RIGHT, width= 50) 

labelName .place (x=10, y=5, width=50, height=20) # 将 标签 放 到 窗口 上 

varName=tkinter.StringVar (value= '') # 与 姓名 关联 的 变量 

entryName=tkinter.Entry (root, width=120, # 创 建文 本 框 
textvariable= varName) # 同 时 设置 关联 的 变量 


entryName .place (x= 70, y=5, width=120, height=20) 
labelGrade= tkinter.Label (root, text= 'Grade:', justify=tkinter.RIGHT, width= 50) 
labelGrade.place(x=10, y= 40, width=50, height=20) 


studentClasses={'1':['1", '2', '3', '4"], # 模 拟 学 生 所 在 年 级 
2u pr, '2'), # 字 典 键 为 年 级 
Ci i WR Pam a i # 字 典 值 为 班级 

comboGrade= tkinter.ttk.Combobox (root, # 学 生年 级 组 合 框 


values= tuple (studentClasses.keys()), width=50) 
comboGrade.place (x= 70, y=40, width=50, height=20) 


def comboChange (event) : # 事 件 处 理 函 数 
grade= comboGrade.get () 
if grade: # 动 态 改变 组 合 框 可 选项 


comboClass ["values"]= studentClasses .get (grade) 
else: 

comboclass.set([]) 
comboGrade .bind('<<ComboboxSelected>>', comboChange) # 绑 定 事 件 处 理 函 数 
labelClass=tkinter.Label (root, text= 'Class:', justify=tkinter.RIGHT, width= 50) 
labelClass.place (x=130, y= 40, width= 50, height=20) 
comboClass=tkinter.ttk.Combobox (root, width= 50) # 学 生 班 级 组 合 框 
comboClass.place (x=190, y= 40, width=50, height=20) 
labelSex=tkinter.Label (root, text='Sex:', justify=tkinter.RIGHT, width= 50) 
labelSex.place (x=10, y=70, width=50, height=20) 


sex= tkinter. IntVar (value= 1) # 与 性 别 关联 的 变量 ,1: 男 ;0: 女 ,默认 为 男 
radioMan= tkinter.Radiobutton (root, # 单 选 钮 , 男 
variable=sex, value=1, text= 'Man') 
radioMan.place (x= 70, y=70, width=50, height=20) 
radioWoman=tkinter.Radiobutton (root, variable=sex, value=0, text= 'Woman') 
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radioWoman.place (x=130, y=70, width=70, height=20) 


monitor=tkinter. IntVar (value= 0) # 与 是 否 班长 关联 的 变量 ,默认 不 是 班长 
checkMonitor= tkinter.Checkbutton (root，text= 'Is Monitor?', variable=monitor, 

onvalue=1, # 选 中 时 变量 值 为 1 

offvalue=0) # 未 选中 时 变量 值 为 0 


checkMonitor.place(x=20, y=100, width=100, height=20) 


def addInformation(): # 按 钮 事件 处 理 函 数 
result= 'Name:' +entryName.get () 
result=result+ ';Grade:' + comboGrade.get () 
result= result+ ';Class:' + comboClass.get () 
result=result+ ';Sex:' + ('Man' if sex.get() else 'Woman') 
result=result+ ';Monitor:' + ("'Yes' if monitor.get() else 'No') 
listboxStudents.insert (0, result) 
buttonAdd=tkinter.Button (root, text= 'Add', width=40, command= addInformation) 
buttonAdd.place (x= 130, y=100, width=40, height=20) 


def deleteSelection (): 
selection= listboxStudents.curselection() 
if not selection: 
tkinter.messagebox.showinfo (title= 'Information', message= 'No Selection') 
else: 
listboxStudents.delete (selection) 
buttonDelete=tkinter.Button (root, text= 'DeleteSelection', 
width=100, command=deleteSelection) 
buttonDelete.place(x=180, y=100, width=100, height=20) 
listboxStudents= tkinter.Listbox (root, width= 300) # 创建 列表 框 组 件 
listboxStudents.place(x=10, y=130, width=300, height=200) 


root .mainloop () 


将 上 面 的 代码 保存 为 tkinter_selction. pyw 文件 ,运行 后 效果 如 图 9-12 所 示 。 


Name: (Wang Wu 


Grade: v Class; 3 
Sex: © Man C Woman 


[I Is Monitor? Add | DeleteSelection | 


jame:Wang Wu;Grade:1;Class:3;Sex:Man;Monitor:t 
jame3k29;Grade:1;Class:3;Sex:Man;Monitor:No 
jame3k2;Grade:1;Class:2;Sex:Woman;Monitor:No 
jameSki:Grade:1;Class:2;Sex:Woman;Monitor:No 
jamessk=;Grade:1;Class:2;SexMan;Monitor-Yes 


图 9-12 程序 运行 效果 
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9.2.3 简单 文本 编辑 器 


下 面 的 案例 通过 设计 一 个 文本 编辑 器 演示 了 菜单 文本 框 、 文 件 对 话 框 等 组 件 的 用 法 ， 
实现 了 打开 文件 .保存 文件 .另存 文件 以 及 文本 的 复制 .前 切 、 粘 贴 和 查找 等 功能 。 
例 9-9 使 用 tkinter 实现 文本 编辑 器 。 


import tkinter 

import tkinter.filedialog 
import tkinter.colorchooser 
import tkinter.messagebox 
import tkinter.scrolledtext 


# 创建 应 用 程序 窗口 

app= tkinter.Tk() 

app.title('My Notepad- - - -by Dong Fuguo') 
app['width']=800 

app['height']= 600 


textChanged= tkinter.IntVar (value= 0) 
# 当前 文件 名 


filename='' 


# 创建 菜单 
menu=tkinter .Menu (app) 
#File 菜单 
Submenu=tkinter.Menu (menu, tearoff=0) 
def Open () : 
global filename 
# 如 果 内 容 已 改变 , 先 保存 
if textChanged.get () : 
Yesno=tkinter.messagebox.askyesno (title= 'Save or not?', 
message= 'Do you want to save?') 
if yesno ==tkinter.YES: 
Save () 
filename=tkinter.filedialog.askopenfilename (title= 'Open file', 
filetypes= [ ("Text files', '* .txt')]) 
if filename: 
# 清 空 内 容 ,0.0 是 LineNumber Colum 的 表示 方法 
txtContent .delete (0.0, tkinter.END) 
fp= open (filename, 'r') 
txtContent .insert (tkinter.INSERT, ''.join(fp.readlines())) 
fp.close() 
# 标 记 为 尚未 修改 
textChanged. set (0) 


# 创 建 Open 菜单 并 绑 定 菜单 事件 处 理 函 数 
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submenu.add_command (label= 'Open', command= Open) 


def Save(): 
global filename 
# 如 果 是 第 一 次 保存 新 建文 件 , 则 打开 "另存 为 "窗口 
if not filename: 
SaveAs () 
# 如 果 内 容 发 生 改 变 ,保存 
elif textChanged.get () : 
fp=open (filename, 'w') 
fp.write (txtContent.get (0.0, tkinter.END)) 
fp.close () 
textChanged.set (0) 


submenu.add_command (label= 'Save', command= Save) 


def SaveAs(): 
global filename 
# 打 开 " 另 存 为 "窗口 
newfilename= tkinter.filedialog.asksaveasfilename (title= 'Save As', 
initialdir=r'c:\\', 
initialfile= 'new.txt') 
# 如 果 指 定 了 文件 名 , 则 保存 文件 
if newfilename: 
fp= open (newfilename, 'w') 
fp.write (txtContent.get (0.0, tkinter.END)) 
fp.close () 
filename= newfilename 
textChanged. set (0) 
submenu.add command (label= 'Save As', command= SaveAs) 
# 添 加 分 割 线 
submenu.add separator () 
def Close(): 
global filename 
Save () 
txtContent.delete (0.0, tkinter.END) 
# 置 空 文件 名 
filename='"' 
submenu.add_command (label= 'Close', command=Close) 
# 将 子 菜单 关联 到 主 菜单 上 


menu.add cascade (label= 'File', menu= submenu) 


#Edit 菜单 
submenu= tkinter.Menu (menu, tearoff=0) 


# 撤 销 最 后 一 次 操作 


def Undo(): 


# 启 用 undo 标志 
txtContent [rundo']= True 
try: 
txtContent edit undo() 
except Exception as e: 
pass 
submenu.add_command (label= "Undo", command= Undo) 


def Redo (): 
txtContent ['undo']=True 
try: 
txtContent .edit_redo() 
except Exception as e: 
pass 
submenu.add_command (label= 'Redo', command= Redo) 
submenu.add_separator () 


def Copy(): 
txtContent.clipboard_clear () 
txtContent.clipboard_append(txtContent.selection_get ()) 
submenu.add_command (label= 'Copy', command= Copy) 


def Cut(): 

Copy () 

# 删除 所 选 内 容 

txtContent .delete(tkinter.SEL FIRST, tkinter.SEL_LAST) 
submenu.add command (label= "Cut", command=Cut) 


def Paste () : 
# 如 果 没 有 选中 内 容 , 则 直接 粘贴 到 鼠标 位 置 
# 如 果 有 所 选 内 容 , 则 先 删除 再 粘贴 
try: 
txtContent.insert (tkinter.SEL_FIRST, txtContent.clipboard_get ()) 
txtContent .delete(tkinter.SEL FIRST, tkinter.SEL_LAST) 
# 如 果 粘 贴 成 功 就 结束 本 函数 ,以 免 异常 处 理 结构 执行 完成 之 后 再 次 粘贴 
return 
except Exception as e: 
pass 
txtContent.insert (tkinter. INSERT, txtContent.clipboard_get ()) 
submenu.add_command (label= 'Paste', command= Paste) 
submenu.add_separator () 


def Search () : 
# 获 取 要 查找 的 内 容 


textToSearch=tkinter.simpledialog-askstring(title='Search', 
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prompt= "What to search?") 
start= txtContent .search (textToSearch, 0.0, tkinter.END) 
if start: 
tkinter.messagebox.showinfo (title= 'Found', message= 'Ok") 
submenu.add_command (label= 'Search', command= Search) 
menu.add_cascade (label= 'Edit', menu= submenu) 


#Help 菜单 
submenu= tkinter .Menu (menu, tearoff=0) 
def About (): 
tkinter.messagebox.showinfo (title= 'About', message= 'Author:Dong Fuguo') 
submenu.add command (label= '"About', command= About) 
menu.add cascade (label= 'Help', menu= submenu) 
# 将 创建 的 菜单 关联 到 应 用 程序 窗口 


app.config (menu=menu) 


# 创建 文本 编辑 组 件 ,并 自动 适应 窗口 大 小 
txtContent=tkinter.scrolledtext.ScrolledText (app，wrap=tkinter.WORD) 
txtContent .pack (fill=tkinter.BOTH, expand= tkinter.YES) 
def KeyPress (event) : 

textChanged. set (1) 
txtContent .bind('<KeyPress>', KeyPress) 


app.mainloop () 


运行 结果 如 图 9-13 所 示 o 


Copyright (c) 2001, 2002, 2003, 2004, 2005, 2006, 2007, 
2008, 2009, 2010, 2011, 

2012, 2013, 2014, 2018 Python Software Foundation. All 
rights reserved. 


[Python 3.x is a new version of the language, which is 
inconpatible with the 

2.x line of releases. The language is nostly the sane, but 
many details, 

especially how built-in objects like dictionaries and 
(strings work, 

Ihave changed considerably, and a lot of deprecated features 
have finally 

been renoved. 


jon Unix, Linux, BSD, OSX, and Cygwin: 


FA 9-13 简单 文本 编辑 器 


9.2.4 简单 画图 程序 


下 面 的 程序 实现 了 简单 的 画图 功能 ,包括 曲线 直线 、 和 矩形、 文本 的 绘制 ,前 景色 和 背景 
色 的 选取 和 设置 ,图 片 文件 的 打开 与 显示 ,以 及 橡皮 控 功 能 ,主要 使 用 了 canvas 和 menu 组 
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件 ,还 用 到 颜色 选择 对 话 框 ,并 演示 了 鼠标 事件 处 理 函 数 的 运用 。 
例 9-10 使 用 tkinter 实现 画图 程序 。 


import tkinter 
from PIL import Image 


app=tkinter.Tk() 

app.title('My Paint----by Dong Fuguo') 
app['width']=800 

app["height']= 600 


# 控 制 是 否 允 许 画 图 的 变量 ,1: 允许 ,0: 不 允许 

yesno= tkinter.IntVar (value= 0) 

# 控 制 画图 类 型 的 变量 ,1: 曲线 ,2: 直线 ,3: 矩形 ,4: 文本 ,5: 橡皮 
what=tkinter. IntVar (value= 1) 

# 记 录 鼠 标 位 置 的 变量 

X=tkinter.IntVar (value= 0) 

Y=tkinter.IntVar (value= 0) 

# 前 景色 

foreColor= '# 000000" 

backColor= '# FFFFFF' 


+ 创建 画布 
image= tkinter.PhotoImage () 
canvas=tkinter.Canvas (app, bg= 'white', width=800, height= 600) 
canvas.create_image(800, 600, image= image) 
# 单 击 ,允许 画图 
def onLeftButtonDown (event) : 
yesno.set (1) 
X.set (event.x) 
Y.set (event.y) 
if what.get ()==4: 
# 输 出 文本 
canvas.create_text(event.x, event.y, text=text) 


canvas.bind('<Button-1>', onLeftButtonDown) 


# 记 录 最 后 绘制 图 形 的 id 
lastDraw=0 
# 按 住 鼠标 左 键 移动 ,画图 
def onLeftButtonMove (event) : 
if yesno.get ()==0: 
return 
if what.get ()==1: 
# 使 用 当前 选择 的 前 景色 绘制 曲线 


canvas.create line (X.get () ，Y.get () event.x, event.y, fill=foreColor) 
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X.set (event .x) 
Y.set (event.y) 
elif what .get ()==2: 
# 绘 制 直线 , 先 删除 刚刚 画 过 的 直线 ,再 画 一 条 新 的 直线 
global lastDraw 
try: 
canvas .delete (lastDraw) 
except Exception as e: 
pass 
lastDraw= canvas.create_line(X.get(), Y.get(), event.x, event.y, fill= 


foreColor) 


elif what.get ()= 
PER HAN ELT» A BN BFP) Se TZ, FI — FS a AY TZ 
global lastDraw 
try: 


canvas .delete (lastDraw) 
except Exception as e: 
pass 
lastDraw= canvas.create_rectangle(X.get(), Y.get(), event.x, event.y, 
fill=backColor, outline=foreColor) 
elif what.get ()==5: 
# 橡 皮 , 使 用 背景 色 填充 10X 10 的 矩形 区 域 
canvas.create_rectangle(event.x-5, event.y-5, event.x+5, event.y+5, 
outline=backColor, fill=backColor) 
canvas.bind('<Bl-Motion>', onLeftButtonMove) 


# 鼠标 左 键 抬 起 ,不 允许 画图 
def onLeftButtonUp (event) : 
if what.get ()==2: 

# 绘 制 直线 


canvas.create_line(X.get(), Y.get(), event.x, event.y, fill=foreColor) 


elif what.get ()= 
# 绘 制 矩形 
canvas.create rectangle (X.get(), Y.get(), event.x, event.y, 

£ill=backColor, outline= foreColor) 

yesno.set (0) 

global lastDraw 

lastDraw=0 

canvas.bind('<ButtonRelease-1>', onLeftButtonUp) 


# 创 建 菜单 


menu=tkinter.Menu (app, tearoff=0) 


# 打 开 图 像 文 件 


def Open () : 
filename=tkinter.filedialog-askopenfilename (title= 'Open Image', 


filetypes=[("image', '* .jpg * .png * .gif")]) 


if filename: 
global image 
image=tkinter.PhotoImage (file= filename) 
canvas.create_image (80, 80, image= image) 
menu.add command (label= 'Open', command= Open) 
# 添 加 菜单 ,清除 绘制 的 所 有 图 形 
def Clear(): 
for item in canvas.find all(): 
canvas.delete (item) 
menu.add command (label= 'Clear', command= Clear) 
# 添加 分 割 线 
menu.add_separator () 
# 创建 子 菜单 ,用 来 选择 绘图 类 型 
menuTYPe=tkinter.Menu (menu, tearoff=0) 
def drawCurve(): 
what .set (1) 
menuType.add_command (label= 'Curve', command=drawCurve) 
def drawLine(): 
what .set (2) 
menuType.add_command (label= 'Line', command=drawLine) 
def drawRectangle () : 
what .set (3) 


menuType.add_command (label= 'Rectangle', command=drawRectangle) 


def drawText (): 
global text 


text=tkinter.simpledialog.askstring (title= 'Input what you want to draw', prompt='') 


what.set (4) 
menuType.add_command (label= 'Text', command=drawText) 
menuType.add_separator () 
# 选 择 前 景色 
def chooseForeColor () : 
global foreColor 


foreColor=tkinter.colorchooser.askcolor () [1] 


menuType. add _ command ( label = ' Choose Foreground Color 


chooseForeColor) 
# 选 择 背 景色 
def chooseBackColor () : 
global backColor 
backColor=tkinter.colorchooser.askcolor() [1] 


menuType.add_command (label= "Choose Background Color", command=chooseBackColor) 


# 橡 皮 
def onErase() : 
what .set (5) 
menuType.add_command (label= "Erase", command=onErase) 
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menu.add cascade (label= "Type", menu=menuType) 


# 鼠标 右键 抬 起 ,在 鼠标 位 置 弹出 菜单 
def onRightButtonUp (event) : 

menu.post (event.x_root, event.y_root) 
canvas.bind('<ButtonRelease- 3> ', onRightButtonUp) 
canvas.pack (fill=tkinter.BOTH, expand=tkinter.YES) 


app.mainloop () 


程序 运行 结果 如 图 9-14 所 示 。 


ET 


Rectangle 
Text 


Choose Foreground Color 
Choose Background Color 
Erase 


Written in Python 


Written in Python 


图 9-14 简单 画图 程序 


9.2.5 电子 时 钟 


下 面 的 案例 实现 了 电子 时 钟 ,使 用 Label 组 件 实时 显示 当前 日 期 和 时 间 ,涉及 的 知识 主 
要 有 多 线程 ( 见 第 13 章 ) 、 无 标题 栏 , 半 透明 、 顶 端 显示 、 可 拖 动 窗 体 的 设计 。 

例 9-11 使 用 tkinter 实现 电子 时 钟 。 

import tkinter 

import threading 


import datetime 
import time 


app=tkinter.Tk() 


app. overrideredirect (True) # 不 显示 标题 栏 
app.attributes('-alpha', 0.9) # 半 透明 
app.attributes('-topmost', 1) # 总 是 在 顶端 
app.geomet ry ("110x25+ 100+ 100') # 初 始 大 小 与 位 置 


labelDateTime=tkinter .Label (app) 
labelDateTime.pack (fill=tkinter.BOTH, expand=tkinter.YES) 
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labelDateTime .configure (bg= 'gray') 


X=tkinter. IntVar (value= 0) # 记 录 鼠 标 左 键 按 下 的 位 置 
Y=tkinter.IntVar (value= 0) 

canMove=tkinter.IntVar (value=0) # 窗 口 是 否 可 拖 动 
still=tkinter. IntVar (value=1) tT 


def onLeftButtonDown (event) : 


app.attributes ('-alpha', 0.4) # 开 始 拖 动 时 增加 透明 度 
X.set (event .x) # 鼠标 左 键 按 下 ,记录 当前 位 置 
Y.set (event.y) 

canMove.set (1) # 并 标记 窗口 可 拖 动 


labelDateTime.bind('<Button-1>', onLeftButtonDown) 


def onLeftButtonUp (event) : 
app.attributes('-alpha', 0.9) # 停 止 拖 动 时 恢复 透明 度 
canMove.set (0) # ln 2c Az ic HO AT Ha zh 


labelDateTime.bind('<ButtonRelease- 1> ', onLeftButtonUp) 


def onLeftButtonMove (event) : 

if canMove.get ()==0: 

return 

newX=app.winfo_x()+ (event.x-X.get ()) 

newY=app.winfo_y()+ (event.y- Y.get ()) 

g= '110x25+ "+ str (newX)+ "+ "+ str (newY) 

app. geometry (g) # 修 改 窗口 的 位 置 
labelDateTime.bind('<Bl-Motion>', onLeftButtonMove) 


def onRightButtonDown (event) : 

still.set (0) 

t.join(0.2) 

app.destroy () # 关 闭 窗口 
labelDateTime.bind('<Button- 3> '，onRightButtonDown) 


def nowDateTime () : 


while still.get ()==1: 
now= datetime.datetime.now() 
s=str (now. year)+ '~ '+ str (now.month) + '- '+ str (now.day)+' ' 
s=st str (now.hour)+ ' :'+ str (now.minute)+ ' :'+ str (now.second) 
labelDateTime['text']=s # 显 示 当 前 时 间 
time.sleep (0.2) 

t=threading. Thread (target=nowDateTime) 

t.daemon=True 


t.start () 


231 


《Python 程序 设计 (第 2 版 )》 


app-mainloop () 
程序 运行 界面 如 图 9-15 所 示 。 


= RESTART: C:/Python 3. 5/tkinter_DigitalWatch. pyw == 
= RESTART: cr SBE Dicitalvatch. pyw == 
= RESTART: C:/Python 3. 5/tkinter_DigitalWatch. pyw == 


图 9-15 电子 时 钟 运行 截图 


本 章 小 结 


(1) wxPython 是 跨 平台 的 GUI 模块 , 除 此 之 外 ,还 可 以 使 用 Python 内置 的 Tkinter 以 
及 基于 Java 的 Jython 和 支持 .NET 的 IronPython 等 开发 环境 来 支持 GUI 编程 。 

(2) 框架 类 Frame 是 可 以 包含 标题 栏 菜单 .按钮 . 单 选 按 钮 .文本 框 、 组 合 框 等 其 他 控 
件 的 容器 。 

(3) 如 果 无 法 确定 使 用 哪个 数值 作为 控件 ID, 可 以 使 用 wx. NewId() 函 数 来 生成 
ID 号, 这样 就 可 以 避免 确保 ID 号 唯一 性 的 麻烦 。 也 可 以 使 用 全 局 常量 wx. ID_ ANY 
( 值 为 一 1) 来 让 wxPython 自动 生成 新 的 唯一 ID 号 ,需要 时 可 以 使 用 GetId() 方 法 来 得 
ae. 

(4) 静态 文本 控件 StaticText 一 般 不 用 来 响应 用 户 的 鼠标 单 击 、 双 击 等 交互 操作 。 

(5) 文本 框 主要 用 来 接收 用 户 的 文本 输入 ,可 以 使 用 GetValue() 方 法 获取 文本 框 中 输 
入 的 内 容 , 也 使 用 SetValue() 方 法 设置 文本 框 中 的 文本 。 

(6) 按钮 控件 Button 上 显示 的 文本 可 以 通过 SetLabelText() 方 法 动态 改变 ,结合 获取 
文本 的 GetLabelText() 方 法 可 以 让 一 个 按钮 实现 多 个 功能 。 

(7) 下 拉 菜 单 和 弹出 式 菜单 的 菜单 项 事件 处 理 函 数 绑 定 方式 是 一 样 的 。 

(8) 对 话 框 需要 首先 创建 ,然后 运行 并 显示 对 话 框 ,最 后 再 获取 对 话 框 的 返回 值 。 

(9) 同一 组 中 的 多 个 单 选 按钮 控件 的 选择 是 互 斥 的 ,而 复 选 框 控件 的 选择 不 是 互 斥 的 。 

(10) 使 用 组 合 框 控件 的 Set() 方 法 可 以 改变 组 合 框 的 可 选项 列表 。 

(11) 树 形 控件 常用 来 显示 有 严格 层次 关系 或 从 属 关 系 的 数据 。 

(12) Python 标准 库 tkinter 是 对 Tcl/Tk 的 进一步 封装 ,与 tkinter. ttk 和 tkinter. tix 
共同 提供 了 强大 的 跨 平台 GUI 编程 的 功能 。 

(13) 可 以 使 用 tkinter. StringVar() 创 建 与 特定 组 件 关 联 的 字符 串 变量 ,使 用 tkinter. 
IntVar() 创 建 与 特定 组 件 关 联 的 整 型 变量 。 

(14) 组 合 框 组 件 比 较 常 用 的 事件 是 <<ComboboxSelected>> ,表示 选择 项 发 生 了 改变 。 

(15) tkinter. filedialog 可 用 于 显示 打开 文件 和 另存 文件 对 话 框 。 

(16) tkinter. colorchooser 可 用 于 显示 颜色 选择 器 对 话 框 。 

(17) tkinter 中 Tk 类 的 对 象 可 通过 调用 attributes(“alpha',0.9) 对 透明 度 进行 设置 。 
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GUI 编程 


J wf 


1. 设计 一 个 窗 体 ,并 放置 一 个 按钮 , 单 击 按钮 后 弹出 颜色 对 话 框 ,关闭 颜色 对 话 框 后 提 
示 选 中 的 颜色 。 

2. 设计 一 个 窗 体 , 并 放置 一 个 按钮 ,按钮 默认 文本 为 “开始 ”, 单 击 按钮 后 文本 变 为 “ 结 
东 ”, 再 次 单 击 后 变 为 “开始 ”, 循 环 切换 。 

3. 设计 一 个 窗 体 ,模拟 QQ 登录 界面 , 当 用 户 输 入 号 码 123456 和 密码 654321 时 提示 
正确 ,否则 提示 错误 。 
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第 10 章 网 络 程序 设计 


Socket 是 计算 机 之 间 进 行 网 络 通信 的 一 套 程序 接口 ,最 初 由 Berkeley 大 学 研发 ,目前 
已 经 成 为 网 络 编程 的 标准 ,可 以 实现 跨 平 台 的 数据 传输 。Socket 是 网 络 通信 的 基础 ,相当 
于 在 发 送 端 和 接收 端 之 间 建 立 了 一 个 管道 来 实现 数据 和 命令 的 相互 传递 。Python 提供 了 
socket 模块 ,对 Socket 进行 了 二 次 封装 ,支持 Socket 接口 的 访问 ,大 幅度 简化 了 程序 的 开 
发 步骤 ,提高 了 开发 效率 。 除 此 之 外 ,Python 还 提供 了 urllib 等 大 量 模块 可 以 对 网 页 内 容 
进行 读 取 和 处 理 , 在 此 基础 上 结合 多 线程 编程 以 及 其 他 有 关 模 块 可 以 快速 开发 网 页 候 虫 之 
类 的 应 用 。 可 以 使 用 Python 语言 编写 CGI 程序 ,也 可 以 把 Python 代码 嵌入 到 网 页 中 运 
行 ,而 借助 于 web2py、Flask、Django 框架 , 则 可 以 快速 开发 网 站 应 用 。 本 章 将 依次 介绍 上 
述 几 个 方面 的 应 用 开发 。 


10.1 计算 机 网 络 基 础 知识 


(1) 网 络 体系 结 构 。 目 前 较为 主流 的 网 络 体系 结构 是 ISO/OSI 参考 模型 和 TCP/IP 协 
议 族 。 这 两 种 体系 结构 都 采用 了 分 层 设计 和 实现 的 方式 。 例 如 ,ISO/OSI 参考 模型 从 上 而 
下 划分 为 应 用 层 、 表 示 层 、 会 话 层 \ 传 输 层 、 网 络 层 、 数 据 链 路 层 和 物理 层 , 而 TCP/IP 则 将 网 
络 划 分 为 应 用 层 \ 传 输 层 、 网 络 层 和 链 路 层 。 分 层 设计 的 好 处 是 ,各 层 可 以 独立 设计 和 实现 ， 
只 要 保证 相 邻 层 之 间 的 调用 规范 和 调用 接口 不 变 , 就 可 以 方便 .灵活 地 改变 某 层 的 内 部 实现 
以 进行 优化 或 完成 其 他 需求 。 

(2) 网 络 协议 。 网 络 协议 是 计算 机 网 络 中 进行 数据 交换 而 建立 的 规则 、 标 准 或 约定 的 
集合 。 网 络 协议 的 三 要 素 分 别 为 语法 .语义 和 时 序 。 简 单 地 讲 , 可 以 这 人 么 理解 ,语义 表示 要 
做 什么 ,语法 表示 要 怎么 做 ,时 序 规定 了 各 种 事件 出 现 的 顺序 。 

O 语法 。 语 法 规定 了 用 户 数据 与 控制 信息 的 结构 与 格式 。 

@ 语义 。 语义 用 来 解释 控制 信息 每 个 部 分 的 意义 ,规定 了 需要 发 出 何 种 控制 信息 ,以 
及 需要 完成 的 动作 和 做 出 什么 样 的 响应 。 

@ 时 序 。 时 序 是 对 事件 发 生 顺 序 的 详细 说 明 ,也 可 称 为 “同步 ”。 

(3) 应 用 层 协议 。 应 用 层 协 议 直 接 与 最 终 用 户 进 行 交互 ,定义 了 运行 在 不 同 终端 系统 
上 的 应 用 程序 进程 如 何 相互 传递 报 文 。 下 面 简 单列 出 几 种 常见 的 应 用 层 协议 。 

O DNS。 域 名 服务 ,用 来 实现 域名 与 IP 地 址 的 转换 。 

© FTP。 文 件 传输 协议 ,可 以 通过 网 络 在 不 同 平台 之 间 实 现 文件 的 传输 。 

© HTTP。 超 文本 传输 协议 。 

@ SMTP。 简 单 邮件 传输 协议 。 

© TELNET。 远程 登录 协议 。 

(4) 传输 层 协议 。 在 传输 层 主 要 运行 着 TCP 和 UDP 两 个 协议 ,其 中 TCP 是 面向 连接 
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的 .具有 质量 保证 的 可 靠 传输 协议 ,但 开销 较 大 ; UDP 是 尽 最 大 能 力 传输 的 无 连接 协议 , 开 
销 小 ,常用 于 视频 在 线 点 播 (Video On Demand. VOD) 之 类 的 应 用 。TCP 和 UDP 并 没有 
优 劣 之 分 ,仅仅 是 适用 场合 有 所 不 同 。 在 传输 层 , 使 用 端口 号 来 标识 和 区 分 具体 的 应 用 层 进 
程 ,每 当 创 建 一 个 应 用 层 网 络 进程 时 系统 就 会 自动 分 配 一 个 端口 号 与 之 关联 ,是 实现 网 络 上 
端 到 端 通信 的 重要 基础 。 

(5) IP 地 址 。IP 运行 于 网 络 体系 结构 的 网 络 层 ,是 网 络 互 连 的 重要 基础 。IP 地 址 
(32 位 或 128 位 二 进 制 数 ) 用 来 标识 网 络 上 的 主机 ,在 公开 网 络 上 或 同一 个 局 域 网 内 部 ,每 
台 主 机 都 必须 使 用 不 同 的 IP 地 址 ;而 由 于 网 络 地 址 转换 (Network Address Translation , 
NAT ) 和 代理 服务 器 等 技术 的 广泛 应 用 ,不 同 内 网 之 间 的 主机 TP 地 址 可 以 相同 并 且 可 以 互 不 
影响 地 正常 工作 。 了 地 址 与 端口 号 共同 来 标识 网 络 上 特定 主机 上 的 特定 应 用 进程 ,俗称 
Socket. 

(6) MAC 地 址 。MAC 地 址 也 称 为 网 卡 地 址 或 物理 地 址 ,是 一 个 48 位 的 二 进 制 数 ,用 
来 标识 不 同 的 网 卡 物理 地 址 。 本 机 的 TP 地 址 和 MAC 地 址 可 以 在 命令 提示 符 窗口 中 使 用 
ipconfig/all 命令 查看 ,可 参考 图 10-1, 


国 全 Sw ele] 2] 
E: \Python3S MipconF ig/all 
Windows IP 配置 
| ”主机 名 
hand 


Intel¢R> WiFi Link 5100 AGN 
|-22-FA-3F-65-E6 


= Marvell Yukon 88E8872 PCI-E Gigab 


BB-25-B3-42-91-41 


80: :f9e9 :a395 :3336 :36cdz11 < BË 

192.168 .8.103< i> 
5.255.255.0 

916 年 1 月 26 日 13:55:07 

2816 年 1 月 27 日 13:55:07 ~ 


图 10-1 查看 本 机 IP 地 址 


10.2 UDP Al TCP 编程 


如 前 所 述 ,UDP 和 TCP 是 网 络 体系 结构 中 运输 层 (也 称 为 传输 层 ) 运 行 的 两 大 重要 协 
议 , 其 中 TCP 适用 于 对 效率 要 求 相对 低 而 对 准确 性 要 求 相对 高 的 场合 ,例如 文件 传输 、 电 子 
邮件 等 ;而 UDP 适用 于 对 效率 要 求 相 对 高 ,对 准确 性 要 求 相对 低 的 场合 ,例如 视频 在 线 点 
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播 、 网 络 语音 通话 等 。 在 Python 中 ,主要 使 用 socket 模块 来 支持 TCP 和 UDP 编程 。 
10.2.1 UDP 编程 


UDP 属于 无 连接 协议 ,在 UDP 编程 时 不 需要 首先 建立 连接 ,而 是 直接 向 接收 方 发 送信 
息 。UDP 编程 经 常用 到 的 socket 模块 方法 有 3 个 。 

(1) socket([family[ ,type[ ,proto]]]): 创建 一 个 Socket 对 象 ,其 中 family X socket. 
AF_INET 表示 IPV4,socket. AF_INET6 表示 IPV6;type 为 SOCK_STREAM 表示 TCP, 
SOCK_DGRAM 表示 UDP. 

(2) sendto(string,address) ; 把 string 指定 的 内 容 发 送 给 address 指定 的 地 址 ,其 中 address 
是 一 个 包含 接收 方 主机 TP 地 址 和 应 用 进程 端口 号 的 元 组 ,格式 为 (IP 地址 ,端口 号 ) 。 

(3) recvfrom(bufsize[ ,flags]) : 接收 数据 。 

下 面 通过 一 个 示例 来 简单 了 解 如 何 使 用 UDP 进行 网 络 通信 。 

例 10-1 UDP 通信 程序 。 

发 送 端 发 送 一 个 字符 串 ,假设 接收 端 在 本 机 5000 端口 进行 监听 ,并 显示 接收 的 内 容 , 如 
果 收 到 字符 串 bye( 忽 略 大 小 写 ) 则 结束 监听 。 

接收 端 代码 : 


import socket 
# 使 用 Teva 协议 ,使 用 UDP 协议 传输 数据 
s= socket .socket (socket .AF INET, socket.SOCK DGRAM) 
# 绑 定 端口 和 端口 号 , 空 字符 串 表 示 本 机 任何 可 用 IP 地 址 
s.bind(('', 5000)) 
while True: 
data, addr= s.recvfrom(1024) 
# 显 示 接收 到 的 内 容 
print ("received message: {0} from PORT {1} on {2}'.format (data.decode (), 
addr [1], addr [0])) 
if data.decode() .lower () == "bye": 
break 


s.close() 

发 送 端 代码 : 

import socket 

import sys 

s= socket .socket (socket .AF_INET, socket .SOCK_DGRAM) 
# 假 设 192.168.0.103 是 接收 端 机 器 的 IP 地 址 


s.sendto (sys.argv[1] .encode () , ("192.168.0.103" ,5000)) 


s.close() 


在 上 面 的 发 送 端 程序 中 假设 接收 端 主机 IP 地 址 为 192. 168. 0. 103 ,可 能 与 你 的 计算 机 
配置 并 不 一 样 。 可 以 在 命令 提示 符 环境 中 使 用 命令 ipconfig/all 查看 本 机 IP 地 址 ,如 图 10-1 
所 示 ,然后 对 发 送 端 代码 中 的 IP 地 址 做 相应 修改 。 如 果 对 命令 提示 符 不 熟悉 ,也 可 以 使 用 
下 面 的 代码 来 获取 本 机 IP 地 址 和 网 卡 物理 地 址 。 
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import socket 
import uuid 


ip= socket .gethostbyname (socket.gethostname () ) 
node=uuid.getnode () 
macHex=uuid.UUID (int= node) .hex[- 12:] 
mac= [] 
for i in range (len (macHex)) [::2]: 
mac.append (macHex [i:i+2]) 
mac= ':' .join (mac) 
print ('IP:', ip) 
print ("MAC:', mac) 
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将 上 面 的 代码 分 别 保存 为 receiver. py 和 sender. py, 然 
境 并 运行 接收 端 程序 ,这 时 接收 端 程序 处 于 阻塞 状态 


后 首先 启动 一 个 命令 提示 符 环 
, 接 下 来 再 启动 一 个 新 的 命令 提示 符 环 


境 并 运行 发 送 端 程序 ,此 时 会 看 到 接收 端 程序 继续 运行 并 显示 接收 到 的 内 容 以 及 发 送 端 程 


序 所 在 计算 机 IP 地 址 和 占用 的 端口 号 。 


当 发 送 端 发 送 字符 串 bye 后 ,接收 端 程序 结束 ,此 


后 再 次 运行 发 送 端 程序 时 接收 端 没 有 任何 反应 ,但 发 送 端 程序 也 并 不 报错 。 这 正 是 UDP 
协议 的 特点 , 即 “ 尽 最 大 努力 传输 ”, 并 不 保证 非常 好 的 服务 质量 。UDP 通信 程序 运行 结果 


如 图 10-2 所 示 。 


10.2.2 TCP 编程 


:\Python35> 


hello fron PORT 61684 on 192.168.0. m 
hello world from PORT 61687 on 192.11 
odd morning from PORT 61692 on 192. 
234567 from PORT 61713 on 192.168.0.183 
DIBT from PORT 61718 on 192.168.8.103 
ceived message:Bye from PORT 61719 on 192.168.8.183 


|c:\Python35>python sender.py hello world 


|c:\Python35>python sender.py ‘hello world’ 
{c:\Python35>python sender.py “hello world” 
\c:\Python35>python sender.py "godd morning" 
|c:\Python35>python sender.py 1234567 
\c:\Python35>python sender.py SDIBT 
[:\Python35>python sender.py Bye 
|e:\Python35>python sender.py hi 


|c:\Python35>python sender.py Why? 


CC: \Python35> 


图 10-2 UDP 通信 程序 运行 结果 


TCP 一 般 用 于 要 求 可 靠 数据 传输 的 场合 。 编 写 TCP 程序 时 经 常 需要 用 到 的 socket 模 


块 的 方法 主要 有 6 个 。 
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(1) connect(address): 连接 远程 计算 机 。 

(2) send(bytes[ ,flags]): 发 送 数据 。 

(3) recv(bufsize[ ,flags]) : 接收 数据 。 

(4) bind(address) : 绑 定 地 址 。 

(5) listen(backlog): 开始 监听 ,等 待 客户 端 连接 。 

(6) accept() : 响应 客户 端的 请 求 。 

例 10-2 TCP 通信 程序 。 

使 用 TCP 协议 进行 通信 需要 首先 在 客户 端 和 服务 端 之 间 建 立 连接 ,并 且 要 在 通信 结束 


后 关闭 连接 以 释放 资源 。TCP 协议 能 够 提供 比 UDP 协议 更 好 的 服务 质量 ,通信 可 靠 性 有 
本 质 上 的 提高 。 下 面 的 代码 简单 模拟 了 机 器 人 聊天 软件 原理 ,服务 端 提前 建立 好 字典 ,然后 
根据 接收 到 的 内 容 自动 回复 。 
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import socket 
words= {"how are you?':'Fine, thank you.', "how old are you?':'38', 
"what is your name?':'Dong FuGuo', ‘what's your name?': "Dong FuGuo', 
‘where do you work?':'SDIBT', 'bye':'Bye'} 
HOST='' 
PORT= 50007 
s= socket .socket (socket .AF_INET, socket.SOCK_STREAM) 
# 绑 定 socket 
s.bind( (HOST, PORT) ) 
# 开 始 监听 
s.listen (1) 
print ("Listening at port:', PORT) 
conn, addr= s.accept () 
print ("Connected by', addr) 
while True: 
data=conn.recv (1024) 
data= data .decode () 
if not data: 
break 
print ("Received message:', data) 
conn.sendall (words.get (data, 'Nothing') .encode()) 


conn.close () 


s.close() 
客户 端 代码 : 
import socket 
HOST='127.0.0.1" # 服 务 端 主机 IP 地 址 
PORT=50007 # 服 务 端 主机 端口 号 
s= socket .socket (socket .AF_INET, socket.SOCK STREAM) 
try: 
s.connect ( (HOST, PORT)) HER 


网 络 程序 设计 


except Exception as e: 
print ("Server not found or not open") 


sys.exit () 


while True: 
c= input ("Input the content you want to send:') 
3.sendall (c.encode ()) # 发 送 数据 
data=s.recv (1024) # 从 服务 端 接收 数据 


data=data.decode () 
print ('Received:', data) 
if c.lower() == 'bye': 
break 
s.close() # 关 闭 连接 


将 上 面 代 码 分 别 保存 为 server. py 和 client. py 文件 ,然后 启动 一 个 命令 提示 符 环境 并 
运行 服务 端 程序 ,服务 端 开始 监听 ;启动 一 个 新 的 命令 提示 符 环境 并 运行 客户 端 程序 ,服务 
端 提示 连接 已 建立 ;在 客户 端 输 入 要 发 送 的 信息 后 ,服务 端 会 根据 提前 建立 的 字典 来 自动 回 
复 。 服 务 端 每 次 都 在 固定 的 端口 监听 ,而 客户 端 每 次 建立 连接 时 可 能 会 使 用 不 同 的 端口 ， 
TCP 通信 程序 运行 结果 如 图 10-3 所 示 。 


TET am 


:\Python35>python server. py 
istening at port: 508007 
nnected by ('127.8.0.1’, 16252) 
ceived message: what’s your name? 
ceived message: how old are you? 
ceived message: how are you? 
ceived message: what are you doing? 
ceived message: bye 


:Python35》 | gy sessa 


:Python35>python client-py 

Input the content you want to send:what’s your name? 
Received: Dong FuGuo 

‘Input the content you want to send:how old are you? 
Received: 38 

[Input the content you want to send:how are you? 
Received: Fine,thank you. 

Input the content you want to send:what are you doing? 
Received: Nothing 

Input the content you want to sendzbye 

Received: Bye 


=\Python35>python client .py 
erver not found or not open 


= \Python35> 


图 10-3 TCP 通信 程序 运行 结果 


10.3 网络 嗅 探 器 与 端口 扫描 器 设计 


10.3.1 网 络 嗅 探 器 


嗅 探 器 程序 可 以 检测 本 机 所 在 局 域 网 内 的 网 络 流量 和 数据 包 收发 情况 ,对 于 网 络 管理 
具有 重要 作用 ,属于 系统 运 维 内 容 之 一 。 为 了 实现 网 络 流量 嗅 探 , 需 要 将 网 卡 设置 为 混杂 模 
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式 , 并 且 运 行 嗅 探 器 程序 的 用 户 账号 需要 拥有 系统 管理 员 权限 。 

例 10-3 网络 嗅 探 器 程序 。 

下 面 的 代码 运行 60s, 然 后 输出 本 机 所 在 局 域 网 内 非 本 机 发 出 的 数据 包 , 并 统计 不 同 主 
机 发 出 的 数据 包 数 量 。 关 于 多 线程 的 知识 请 参考 第 13 章 。 


import socket 
import threading 
import time 


activeDegree= dict () 
flag=1 
def main(): 
global activeDegree 
global flag 
# the public network interface 
HOST= socket .gethostbyname (socket .gethostname () ) 
# create a raw socket and bind it to the public interface 
s=socket.socket (socket .AF_INET, socket .SOCK RAW, socket .IPPROTO_IP) 
s.bind( (HOST, 0)) 
# Include IP headers 
s.setsockopt (socket .IPPROTO_IP, socket.IP_HDRINCL, 1) 
# receive all packages 
3.ioctl (socket.SIO_RCVALL, socket .RCVALL_ON) 
# receive a package 
while flag: 
c=s.recvfrom (65565) 
host=c[1] [0] 
activeDegree [host ]=activeDegree.get (host, 0)+1 
if c[1] [0] !='10.2.1.8': # suppose 10.2.1.8 is the IP address of current host 
print (c) 
# disabled promiscuous mode 
3.ioctl] (socket.SIO_RCVALL, socket .RCVALL_OFF) 
s.close() 
t= threading. Thread (target=main) 
t.start () 
time.sleep (60) 
flag=0 
七 .join () 
for item in activeDegree.items () : 


print (item) 


10.3.2 多 进程 端口 扫描 器 


在 网 络 安全 和 黑客 领域 ,端口 扫描 是 经 常用 到 的 技术 ,可 以 探测 指定 主机 上 是 否 开放 了 
特定 端口 ,进一步 判断 主机 上 是 否 运行 某 些 重要 的 网 络 服务 ,最终 判断 是 否 存 在 潜在 的 安全 
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漏洞 ,从 一 定 意 义 上 讲 也 属于 系统 运 维 的 范畴 。 
例 10-4 ”端口 扫描 器 程序 。 


下 面 代 码 模拟 了 端口 扫描 器 的 工作 原理 ,并 采用 多 进程 技术 提高 扫描 速度 


编程 请 参考 第 13 章 。 


import socket 
import multiprocessing 


def ports (ports service): 
# 获 取 常用 端口 对 应 的 服务 名 称 
for port in list (range (1,100))+ [143, 145, 113, 443, 445, 3389, 8080]: 
try: 
ports_service[port]= socket .getservbyport (port) 
except socket.error: 


pass 


def ports_scan (host, ports_service): 
ports_open= [] 
try: 
sock= socket .socket (socket .AF INET, socket .SOCK_STREAM) 
# 超 时 时 间 的 不 同 会 影响 扫描 结果 的 精确 度 
sock.settimeout (0.01) 
except socket.error: 
print ("socket creation error') 
sys.exit () 
for port in ports_service: 
try: 
尝试 连接 指定 端口 
sock.connect ( (host,Port) ) 
# 记 录 打 开 的 端口 
ports_open.append (port) 
sock.close() 
except socket .error: 
pass 
return ports_open 


if _name_== 
m=multiprocessing.Manager () 
ports_service=dict () 
results=dict () 
ports (ports_service) 
# 创 建 进程 池 , 人 允许 最 多 8 个 进程 同时 运行 
pool=multiprocessing. Pool (processes= 8) 
net= "10.2.1." 


for host_number in map(str, range (8,10) ) : 
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,关于 多 进程 
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host=net+host_number 
# 创 建 一 个 新 进程 ,同时 记录 其 运行 结果 
results [host]=pool.apply async (ports scan, (host, ports service)) 
print ("starting 'thost+'...") 
# 关 闭 进程 池 ,close () HAZE join () 之 前 调用 
pool.close() 
# 等 待 进程 池 中 的 进程 全 部 执行 结束 


pool .join() 


# 打 印 输出 结果 
for host in results: 
print ("=' * 30) 
print (host, '.' * 10) 
for port in results [host] .get (): 


print (port, ':', ports_service[port]) 


10.4 RA AE BE He A UE 


10.4.1 网 页 内 容 读 取 与 域名 分 析 


Python 2. x 提供 了 urllib 和 urllib2 两 个 标准 库 支持 网 页 内 容 读 取 ,Python 3. x 把 这 两 
个 模块 整合 为 urllib 一 个 库 , 主 要 包含 urllib. request, urllib. response, urllib. parse 和 
urllib. error 四 个 部 分 。 


下 面 的 代码 演示 了 如 何 读 取 并 显示 指定 网 页 的 内 容 。 


>>> import urllib.request 

>>> fp=urllib.request.urlopen (r'http://www.python.org') 
>>> print (fp.read (100) ) 

>>> print (fp. read (100) «decode () ) 

>>> fp.close () 


下 面 的 代码 演示 了 如 何 使 用 GET 方法 读 取 并 显示 指定 URL 的 内 容 。 


>>> import urllib.request 
>>> import urllib.parse 
>>> params=urllib.parse.urlencode({'spam': 1, 'eggs': 2, "bacon": 0}) 
>>> url= "http: //www.musi-cal.com/cgi-bin/query?% s" % params 
>>>with urllib.request.urlopen (url) as f: 

print (£.read() decode ("utf- 8')) 


下 面 的 代码 演示 了 如 何 使 用 POST 方法 提交 参数 并 读 取 指定 页 面 内 容 。 


>>> import urllib.request 
>>> import urllib-parse 

>>> data=urllib.parse.urlencode({'spam': 1, 'eggs': 2, "bacon': 0}) 
>>> data=data encode ("ascii') 


242 


网 络 程序 设计 


>>>with urllib.request .urlopen ("http://requestb.in/xrb182xxr", data) as f: 
print (£.read () .decode ("ut £- 8")) 


下 面 的 代码 演示 了 如 何 使 用 HTTP 代理 访问 指定 页 面 。 


>>> import urllib. request 

>>>proxies={'http': "http: //proxy.example.com:8080/"} 

>>> opener=urllib. request .FancyURLopener (proxies) 

>>> with opener .open ("http: //www.python.org") as f: 
f.read() .decode ("ut£- 8") 


另外 ,Python 标准 库 webbrowser 支持 使 用 已 安装 的 浏览 器 直接 打开 网 页 。 可 以 在 命 
令 提示 符 环境 中 执行 下 面 的 命令 : 

python -m webbrowser -t "http://www.python.org" 

在 IDLE 或 者 Python 程序 中 使 用 下 面 的 代码 也 可 以 调用 浏览 器 打开 指定 网 页 : 


import webbrowser 
webbrowser .open ("http://www.python.org') 


最 后 ,标准 库 urllib. parse 提供 了 域名 解析 的 功能 ,支持 拆 分 与 合并 URL 以 及 相对 地 
址 到 绝对 地 址 的 转换 。 


>>> from urllib.parse import urlparse 

>>> o= urlparse ("http://www.cwi.n1:80/% 7Eguido/Python.html') 

>>>o.port 

80 

>>>o.hostname 

'www.cwi.nl' 

>>>urlparse ('//www.cwi.n1:80/% 7Eguido/Python.html') 

ParseResult (scheme='', netloc= 'www.cwi.nl:80', path= '/% 7Eguido/Python.html', params='', 
query='', fragment='') 

>>>urlparse ('www.cwi.nl/% 7Eguido/Python.html') 

ParseResult (scheme= ' ', netloc= '', path= 'www.cwi.nl/% 7Eguido/Python.html ', params= '', 
query='', fragment='') 

>>> from urllib.parse import urljoin 

>>>urljoin ("http: //www.cwi.n1/% TEguido/Python.html', 'FAQ.html') 

"http: //www.cwi.nl/% 7Eguido/FAQ.html' 

>>> url join ("http://www.cwi.n1/% 7Eguido/Python.html', '//www.python.org/% 7Eguido') 

"http: //www.python.org/% 7Eguido' 

>>> from urllib.parse import urlsplit 

>>> url=r'https://docs .python.org/3/library/urllib.parse.html" 


>>> rl=urlsplit (url) 
>>> rl.hostname 

*docs.python.org' 

>>>rl.geturl () 

"https: //docs .python.org/3/library/urllib.parse.html' 


243 


>>>rl.netloc 


'docs.python.org' 


>>> rl.scheme 


"https" 


10.4.2 RRA BMA eR 
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Dea) eR h as FED CE HR PY E RR A h THT MCE 
HAEREA. FREK T AUER aH E R D R Hg A BETE A, 
可 以 指定 关键 字 和 抓 取 深 度 。 如 果 需 要 更 高 级 的 网 页 抓 取 功能 ,请 参考 scrapy 框架 。 


例 10-5 IER FENY o 


import sys 

import multiprocessing 
import re 

import os 


try: 
# Python 3 
import urllib.request as lib 
python3= True 
except Exception: 
# Python 2 
import urllib as lib 
python3= False 
def craw_links(url, depth, keywords, processed) : 
'''url:the url to craw 
depth:the current depth to craw 
keywords:the tuple of keywords to focus 
pool:process pool 


contents= [] 


if url.startswith ("http://') or url.startswith("https://'): 


if url not in processed: 
#mark this url as processed 
processed. append (url) 
else: 
# avoid processing the same url again 
return 
print ('Crawing 'turl+'...") 
fp= lib.urlopen (url) 
if python3: 
# Python3 returns bytes, so need to decode. 
contents= fp.read () 
contents_decoded= contents .decode ('UTF- 8") 
else: 


#Python2 returns str, does not need this decode 


数据 处 理 与 分 析 技 术 可 以 


contents decoded= fp.read() 
fp.close() 
pattern='|'.join (keywords) 
# if this page contains certain keywords, save it toa file 
flag= False 
if pattern: 
searched= re.search (pattern, contents decoded) 
else: 
#if the keywords to filter is not given, save current page 
flag=True 
print (flag, searched) 
if flag or searched: 
if python3: 


with open ('craw\'+url.replace(':','_').replace("/','_'), 'wb') as fp: 
fp.write (contents) 
else: 
with open('craw\'+url.replace(':','_').replace("/','_'), 'w') as fp: 
fp.write (contents_decoded) 
# find all the links in the current page 
links= re. findall ("href="(.*?)"', contents_decoded) 
# craw all links in the current page 
for link in links: 
# consider the relative path 
if not link.startswith(("http://', "https://')): 


try: 
index=url.rindex('/') 
link= url [0:index+ 1]+ link 
except: 
pass 


if depth> 0 and link.endswith(('.htm','.html')): 
craw _links (link, depth-1, keywords, processed) 


' main ': 


processed [] 

keywords= ('KeyWord1', 'KeyWord2') 

if not os.path.exists ('craw') or not os.path.isdir('craw'): 
os.mkdir ('craw') 


craw _links (r'https://docs.python.org/3/library/index.html', 1, keywords, processed) 


10.5 使 用 Python 开发 网 站 


10.5.1 使 用 IIS 运行 Python 网 站 


在 Windows 平台 上 ,为 了 使 IIS 能 够 运 
Windows 7 WARKA l. 


行 Python 程序 ,需要 完成 以 下 几 步 设置 , 以 
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(1) 依次 打开 < 开始 ”一 “控制 面板 ”管理 工具 ?一 “Internet 信息 服务 (IIS) 管 理 器 ”， 
右 击 “ 网 站 ”, 新 建 网 站 并 填写 网 站 基本 信息 ,如 图 10-4 所 示 。 


E 立即 启动 网 站 (M) 


Cej 
图 10-4 在 IIS 中 创建 网 站 


(2) 选择 刚 创建 的 Python 网 站 ,在 右 侧 窗口 中 选择 “处理 程 序 映射 ”然后 在 打开 的 窗 
口中 右 侧 单 击 * 添 加 脚本 映射 ,在 弹出 的 窗口 中 填写 信息 ,如 图 10-5 所 示 。 


ENERE Le@| 至 | 
| 请 求 路 径 (P): 
Ce 
示例 : “bas, wsvcaxd 
可 执行 文件 (E): 
C:\Python35\python.exe %s %s | 四 


| zem: 
| Python 


aiia | 


图 10-5 配置 IIS 的 程序 映射 


(3) 编写 Python 程序 文件 index. py, 并 放置 到 刚刚 创建 的 网 站 根 目录 中 。 代 码 为 
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print ("Status: 200 OK") 
print ('Content- type: text/html") 


print ('') Th localhost:8080/indexpy x 
resin ad i (CoS Sry ra 
print ('<hl> This is a header< /hl> ') € > © |D localhost:8080/index.py 


print ('<p>note:this is only a test.</p>') A . 
This is a header 
(4) 选择 上 面 创建 的 Python 网 站 , 单 击 右 侧 窗口 中 


的 “默认 文档 ”, 然 后 添加 index. py. note:this is only a test. 
(5) 打开 浏览 器 并 输入 刚才 配置 的 网 址 ,浏览 创建 图 10-6 网 站 运行 效果 


的 网 站 ,如 图 10-6 所 示 。 
10.5.2 使 用 web2py 框架 开发 网 站 


Zope2、Web. py、Pyramid、CubicWeb、Dijango 和 web2py 是 目前 比较 流行 的 支持 Python 的 
网 站 开发 框架 。 尽 管 每 个 框架 都 有 自己 的 特色 和 独到 之 处 ,但 其 中 用 户 推 荐 度 较 高 的 当 属 
web2py, 该 框架 中 集成 了 用 户 认证 、 数 据 库 操作 、 模 板 系 统 和 Form 表单 等 大 量 功能 组 件 ， 
能 够 完成 开发 中 的 常用 功能 。 开 发 者 通过 组 合 不 同 的 功能 组 件 , 再 加 上 自己 实现 的 业务 四 
辑 ,就 像 搭 积木 一 样 来 快速 开发 Web 应 用 。 

web2py 框架 使 用 MVC 模式 实现 网 站 开发 , 即 Model-View-Controller 模式 。 其 中 M 
指 模型 , 即 存储 在 数据 库 中 的 待 处 理 数据 ;V 指 视图 ,用 来 决定 数据 的 显示 形式 ;C 指控 制 ， 
即 负责 处 理 用 户 请 求 ,根据 特定 的 业务 逻辑 对 模型 中 的 数据 进行 修改 并 将 新 的 结果 视图 返 
回 给 最 终 用 户 。 使 用 web2py 框架 开发 Web 应 用 的 流程 : 首先 定义 模型 ,然后 编写 控制 多 
辑 , 最 后 实现 视图 ,将 数据 以 特定 的 形式 展示 给 最 终 用 户 。 

可 以 登录 web2py 框架 官方 主页 (http://web2py. com) 下 载 适合 自己 的 压缩 包 , 解 压缩 
后 找到 并 执行 web2py. exe 文件 ,会 看 到 一 个 黑色 的 命令 提示 符 窗口 和 web2py 框架 的 主 窗 
口 ,选择 服务 器 的 IP 地 址 .设置 服务 器 端口 号 和 密码 之 后 , 单 击 start server 按钮 即 可 启动 
web2py 框架 并 打开 web2py 的 欢迎 界面 , 单 击 页 面 右 侧 的 administrative interface 进入 管 
理 员 页 面 ,分 别 如 图 10-7 和 图 10-8 所 示 。 

在 web2py 中 每 一 个 网 站 都 是 一 个 应 用 或 者 APP, 默 认 有 admin、examples 和 welcome 
3 个 应 用 ,如 图 10-8 所 示 。 如 果 需 要 创建 自己 的 应 用 ,可 以 在 图 10-8 中 页 面 右 侧 输入 要 创 
建 的 应 用 名 称 然后 单 击 create 按钮 ,然后 即 可 自动 跳 转 到 相应 应 用 的 设计 与 开发 界面 。 下 
面 我 们 通过 一 个 例子 来 演示 使 用 web2py 开发 Web 应 用 的 流程 ,要 求 网 站 运行 后 接收 用 户 
输入 的 整数 , 单 击 按钮 以 后 判断 该 整数 是 否 为 素数 ,并 给 出 结 

(1) 首先 在 web2py 管理 员 界 面 中 右 侧 文本 框 中 输入 IsPrime, 然 后 单 击 create 按钮 , 进 
入 IsPrime 应 用 的 设计 开发 界面 ,如 图 10-9 所 示 。 

(2) 单 击 控制 器 一 栏 下 方 的 create 按钮 ,然后 输入 IsPrime 并 再 次 单 击 下 面 的 create 按 
钮 , 即 可 看 到 新 创建 的 文件 IsPrime. py, 如 图 10-10 所 示 。 

修改 IsPrime. py 文件 内 容 , 编 写 下 面 的 代码 : 


#- * - coding: utf-8 - * - 
def index() : 
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z 


EA DABARA Python) Python ER RAA CARENS0Sweb2p.. = |S) 加 


þeb2py Web Franevork 


Created by Massino Di Pierro, Copyright 2007-2016 
Version 2.9.12-stable+tinestamp.2615 .@1.17.06.11.83 
Database drivers available: sqlite3. pynysql. psycopg2, pg89 


E web2py Web Framework 


p3 


< ve U httpy//127.0.0.1 a| o axo 
O sax Onn 
py ™ administrative interfa 
WE aamin (currently running) Menage» 
版 本 
WE -es Marage= | Disave 2.9.12-atablestinentanp. 17.06.11 
(unnng on Rocket 1.26, Python 27.6) 
WE cm。 Manage» Disable == 
New simple application 
Appication name 
eate 
Upload and install packed application 
Appication name: 
Upload a package 
Or Get from URL: 
A, 


Server 


Scheduler Info 


WEB 


Pages 


Py 


Version 2.9.12-stable+timestamp.2015.01.17.06.11.03 
Created by Massimo Di Pierro, Copyright 2007-2016 


Server IP: ® Local (IPv4) (127.0.0.1) 

© Local (1Pv6) (1) 

© Public (192.168.0.103) 

© Public (fe80:f9e9:a395:3336:36cd%611 


© Public (0.0.0.0) 


Server Port: 


Choose Password: 


start server erver 


图 10-7 web2py 启动 界面 
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图 10-8 web2py 管理 员 页 面 


ey 


< com Q http://127.0.0.1:8 t Isp 
Osise @iasm Onate 
数据 库 管理 graph model 
wa Be 
wa Fy 
create 
控制 器 se 
测试 定期 事务 
HRR aR 
sa aE 
reste 
视图 @ 
Download layouts from repository 
22) 区 
Wl 区 I layout.htmi 
sal iy 扩展 layout.htmi 
war Ty 扩展 layouthtml 
sa i 扩展 layout.html 
Wl h 


图 10-9 web2py 的 应 用 设计 开发 界面 


控制 器 se 
wt | 定期 事务 


局 ,sprme py WA index 


Fe appadmin py 3898 index, insert, download, csv, select, updal 
hooks 


Fẹ default py 暴露 index, user, download, call, api 


图 10-10 创建 控制 器 文件 


form =FORM(INPUT (_name= 'number', requires=IS NOT EMPTY()),\ 
INPUT (_ type= 'submit")) 
if form.process () .accepted: 
num =int (form.vars.number) 


for i in range (2,num) : 


if numsi ==0: 
session.r = 'No' # 设 置 会 话 变量 
redirect (URL ('result')) # 重 定向 至 result.html 
else: 


session.r = "Yes'" 
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redirect (URL("result')) 
return dict (form= form) 
def result (): 
r =session.r or redirect (URL ("index") ) 
return dict (r=r) 
(3) 在 视图 下 面 使 用 create 按钮 分 别 创建 index 和 result 两 个 视图 文件 ,内 容 如 下 ,其 
中 两 对 大 括号 “{{ })” 中 是 Python 代码 。 
index. html 文件 内 容 : 


{{extend "layout -html'}} 
{{=form}} 


result. html 文件 内 容 : 

{{extend 'layout.html'}} 

<hl> {{=session.r or 'Unknown'}}< /hl> 

然后 在 地 址 栏 中 输入 地 址 http: //127. 0. 0. 1:8000/IsPrime/isprime/index, 7E SAS HE 
内 输入 一 个 整数 , 单 击 旁边 的 按钮 ,页 面 显 示 该 整数 是 否 为 素数 ,如 图 10-11 和 图 10-12 
所 示 。 


M & U htp://127.0.0.1:8000 加 & O hep://127.0.0.1:8000/1sPrime/isprime/resut 
F 上 一 个 


Isprime 


Isprime 


hs Result 
(ez | see w 


图 10-11 index 页 面 图 10-12 result 页 面 


在 web2py 解压 缩 目 录 的 applications 子 目录 中 可 以 找到 新 建 的 IsPrime 应 用 的 所 有 文 
件 , 在 其 中 的 views 子 目录 中 有 相应 的 视图 文件 ,其 中 layout. html 文件 是 web2py 自 带 的 
页 面 样式 ,可 以 根据 自己 喜欢 的 风格 和 样式 进行 修改 。 

最 后 再 给 出 几 个 简单 的 示例 ,可 以 通过 web2py 框架 创建 应 用 并 运行 。 

1. 显示 字符 串 

控制 器 代码 (template_examples. py): 


def test_for(): 
return dict () 


视图 代码 (template_examples/test_for. html) : 
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{{extend "layout -html'}} 

<hl> For loop< /hl> 

{{for number in ['one 'two', 'three']:}} 
<h2> {{=number.capitalize () }}< /h2> 
{{pass}} 


2. 以 超 链接 方式 显示 指定 网 址 
控制 器 代码 (template_examples. py): 


def test def(): 
return dict () 


视图 代码 (template_examples/test_def. html) : 


{{extend 'layout.html'}} 

{{def itemlink (name) :}}< li> { {=A (name, href=name) }}< /li> {{return}} 
<ul> 

{{itemlink('http://www.google.com') }} 

{{itemlink ("http://www. yahoo.com") }} 

{{itemlink ("http://www.nyt.com') }} 

</ul> 

3. 显示 变量 值 

控制 器 代码 (template_examples. py): 


def variables (): 
return dict (a=10, b= 20) 


视图 代码 (template_examples/variables. html) : 


{{extend ‘layout .html'}} 
<hl> Your variables< /hl> 
<h2>a= {{=a}}< /h2> 
<h2> a= {{=b}}< /h2> 


10.5.3 使 用 C# 和 Python AS FR ASP. NET 网 站 


IronPython 插件 使 得 可 以 在 ASP. NET 网 站 中 使 用 Python 代码 ,不 过 目前 只 支持 
Python 2.7. x, 暂 时 还 不 支持 Python 3. x, AWW Visual Sutdio 2008 和 Visual Studio 
2010 为 例 介 绍 如 何在 ASP. NET/C# 网 站 中 使 用 Python 代码 ,Visual Studio 2015 中 已 经 
内 置 支持 Python, ALB. 

1. C# 2008 结合 Python FÈ ASP. NET 网 站 

(1) 创建 Web Site, 并 添加 IronPython. dll 和 Micrsoft. Scripting. dll 两 个 引用 。 

(2) 编写 Python 程序 文件 demo. py, 并 放置 到 网 站 根 目录 中 ,内 容 如 下 : 


def demo (a) : 


return a.split(',') 


(3) 在 默认 页 面 文件 Default. aspx. cs 中 添加 命名 空间 IronPython. Hosting 和 Microsoft. 
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Scripting. Hosting. 


(4) 在 默认 Web Whi Default. aspx 中 放置 一 个 按钮 和 下 拉 列 表 框 ,然后 在 按钮 的 单 击 


事件 处 理 函 数 中 添加 如 下 代码 : 


英文 字母 的 可 选项 。 网 站 运行 效果 如 图 10-13 所 示 。 


dynamic, 大 幅度 方便 了 C# 与 python 语言 的 混合 编程 。 


var engine= Python.CreateEngine (); 
var scope=engine.CreateScope (); 

var source=engine.CreateScriptSourceFromFile (Server .MapPath ("~ ") + "\demo.py") ; 
source.Execute (scope) ; 

var demo= scope.GetVariable< Func< object, object>> ("demo"); 
DropDownList1.DataSource= demo ("a,b,c,d,e") ; 

DropDownList1.DataBind () ; 


(5) 运行 网 站 ,初始 时 下 拉 列 表 框 中 没有 任何 可 选项 , 单 击 按钮 为 下 拉 列 表 框 添加 儿 个 


CHO M htp//od 


2. C# 2010 结合 Python 开发 ASP. NET 网 站 
Visual Studio 2010 的 C#4.0 提供 了 一 个 新 的 关键 字 


在 VS 2010 中 创建 Web Site, 添加 按钮 和 下 拉 列 表 框 ， 


添加 引用 (选择 NET4. 0 版 本 ,在 IronPython 的 安装 目录 1013 网 站 运行 效果 

下 )IronPython. dll 和 Micrsoft. Scripting. dl, 添 加 命名 空间 

IronPython. Hosting 和 Microsoft. Scripting. Hosting, 4% demo. py 文件 ,与 VS 2008 中 
的 操作 步骤 一 样 ,然后 在 按钮 的 单 击 事件 处 理 函 数 中 添加 如 下 代码 : 


ScriptRuntime pyRuntime= Python.CreateRuntime () ; 

dynamic obj=pyRuntime.UseFile (Server .MapPath ("~") +"\demo.py"); 
DropDownList1.DataSource= obj .Split ("a,b,c,d,e"); 
DropDownList1.DataBind () ; 


运行 网 站 , 单 击 按钮 ,运行 效果 与 图 10-13 相同 。 
3. 在 ASP. NET 网 站 中 使 用 C 革 和 Python 混合 处 理 数据 
以 Visual Studio 2010 为 例 , 假 设 有 Access 数据 库 db5. mdb, 表 名 为 test, 第 一 个 字段 


为 整数 类 型 。 创 建 ASP. NET 新 页 面 , 放 置 一 个 按钮 ,在 其 Click 事件 中 编写 代码 : 


252 


string connectionString = @" Provider = Microsoft. Jet. OLEDB. 4. 0; Data Source = 
" +Server.MapPath ("~")+@"\App Data\db5.mdb"; 

OleDbConnection conn=new OleDbConnection () ; 
conn.ConnectionString=connectionString; 

string sql="select * from test"; 

OleDbDataAdapter adapter=new OleDbDataAdapter (sql, conn) ; 
DataSet ds=new DataSet () 7 

adapter .Fill (ds); 

ScriptRuntime pyRuntime= Python.CreateRuntime(); 

dynamic obj=pyRuntime.UseFile (Server.MapPath("~") +™\demo.py"); 
Button1.Text=obj.demol (ds. Tables [0] .Rows) .ToString(); 


上 面 代码 从 Access 数据 库 db5. mdb 中 test 表 查 询 所 有 数据 ,将 返回 的 所 有 数据 行 传 
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递 给 Python 程序 中 的 函数 demol()。 编 写 demo. py 文件 并 放 在 网 站 根 目录 中 ,代码 为 


def demol (v) : 
return v[0] [0]+v[1] [0] 


运行 网 站 并 单 击 按钮 后 按钮 文字 变 为 test 数据 表 中 前 两 行 第 一 个 字段 数字 之 和 。 
10.5.4 Flask 框架 


Flask 是 Python 社区 比较 主流 的 Web 框架 之 一 ,可 以 使 用 pip 工具 安装 Flask 框架 及 
其 扩展 包 。 
例 10-6 使 用 Flask 框架 编写 网 站 程序 。 


from flask import Flask 
app=Flask( name ) 
@app.route("/") 
def hello(): 
return "Hello World!" 
if name =="_main_": 
app.run () 
将 代码 保存 为 flask_test. py 并 运行 ,在 IDLE 中 显示 网 站 已 启动 ,网 站 启动 界面 如 
图 10-14 所 示 。 
使 用 浏览 器 打开 网 址 http://127. 0. 0. 1:5000, 显 示 文 本 "Hello World!", 网 站 运行 效 
果 如 图 10-15 所 示 。 


RESTART: C:/Python 3,5/flask_test, py == e DB eoorso00 | 
/127.0.0.1:5000/ (Press CTRL+C to quit) 


127.0.0.1 - - [26/Dec/2015 15:41:41] “GET / HTTP/1.1” 200 - Hello World! 
图 10-14 网 站 启动 界面 10-15 ”网 站 运行 效果 


例 10-7 Python 十 flask 十 flask-email 发 送 带 附件 的 电子 邮件 。 
运行 下 面 的 程序 之 前 ,需要 使 用 pip install flask-mail 安装 电子 邮件 扩展 包 。 


import os.path 
from flask import Flask 
from flask.ext.mail import Mail, Message 


app=Flask( name ) 

# 以 126 免 费 邮箱 为 例 

app.config['MAIL SERVER']='smtp.126.com' 

app.config['MAIL PORT']=25 

app.config['MAIL USE TLS']=True 

# 如 果 电 子 邮箱 地 址 是 abcde 126.com, 那 么 应 填写 abcd 
app-config['MAIL USERNAME']= 'your own username of your email' 
app.config['MAIL PASSWORD']= 'your own password of the username’ 


def sendEmail (From, To, Subject, Body, Html, Attachments) : 
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""'To:must be a list''' 
msg=Message (Subject, sender=From, recipients=To) 
msg.body= Body 
msg.html=Html 
for f in Attachments: 
with app.open resource (f) as fp: 
msg.attach (filename=os.path.basename(f), data=fp.read(), 
content_type= 'application/octet- stream') 
mail=Mail (app) 
with app.app_ context (): 


mail.send (msg) 


if name =='_main _': 
# From 填 写 的 电子 邮箱 地 址 必须 与 前 面 配置 的 相同 
From= '< your email address> ' 
# 作 者 QQR 邮箱 
To= ['< 306467355@ qq.com> '] 
Subject= 'hello world' 
Body= 'Only a test." 
Html= '<hl>test test test.</hb>' 
Attachments = ['c:\python35\python.exe'] 
sendEmail (From, To, Subject, Body, Html, Attachments) 


AS 章 小 结 


(1) IP 地 址 和 端口 号 共同 来 标识 网 络 上 特定 主机 上 的 特定 应 用 进程 , 称 为 Socket, 

(2) TCP 适用 于 对 效率 要 求 较 低 而 对 准确 性 要 求 较 高 的 场合 ,是 面向 连接 .具有 服务 
质量 保证 的 可 靠 传输 协议 ,而 UDP 属于 无 连接 协议 ,可 能 会 发 生 丢 包 或 其 他 错误 ,适用 于 
视频 在 线 点 播 、 网 络 语音 通信 之 类 的 场合 。 

(3) urllib 模块 提供 了 大 量 对 象 和 方法 支持 网 页 内 容 读 取 , 结 合 密码 模块 以 及 多 线程 纺 
程 可 以 轻松 实现 网 络 息 虫 程序 。 

(4) 既 可 以 使 用 Python 编写 CGI 程序 来 动态 生成 网 页 ,也 可 以 把 Python PH) ¥ i A 
,asp 文件 。 

(5) web2py 框架 集成 了 用 户 认 证 ,数据库 操作 和 模板 系统 等 大 量 功能 组 件 以 支持 Web 
开发 。 

(6) UDP 协议 的 特点 是 “ 尽 最 大 努力 传输 ”, 不 保证 非常 好 的 服务 质量 。 

(7) 为 了 实现 网 络 流量 嗅 探 ,需要 将 网 卡 设置 为 混杂 模式 ,并 且 运 行 嗅 探 器 程序 的 用 户 
账号 需要 拥有 系统 管理 员 权限 。 

(8) 端口 扫描 技术 可 以 探测 指定 主机 上 是 否 开放 了 某 些 端口 ,进一步 判断 主机 上 是 否 
运行 某 些 重 要 的 网 络 服 务 ,最 终 判 断 是 否 存 在 潜在 的 安全 漏洞 。 

(9) Python 2. x 提供 了 urllib 和 urllib2 两 个 标准 库 支 持 网 页 内 容 读 取 ,Python 3. x 对 
这 两 个 模块 进行 整合 , 仅 提 供 urllib 一 个 库 , 主要 包含 urllib. request, urllib. response, 
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urllib. parse 和 urllib. error 四 个 部 分 。 

(10) Python 标准 库 webbrowser 支持 使 用 已 安装 的 浏览 器 直接 打开 网 页 ,标准 库 
urllib. parse 提供 了 域名 解析 的 功能 ,支持 拆 分 与 合并 URL 以 及 相对 地 址 到 绝对 地 址 的 
转换 。 

AD 为 了 让 IIS 支持 Python 程序 的 运行 ,需要 在 “处 理 程序 映射 ?功能 中 添加 脚本 映 
射 , 并 选择 合适 的 Python 语言 解释 器 。 

(12) C# 4.0 提供 了 关键 字 dynamic, 大 幅度 方便 了 与 Python 语言 的 混合 编程 。 

(13) Django,Flask 和 web2py 是 比较 主流 的 Web 开发 框架 。 


习 题 


1. 简单 解释 TCP 和 UDP 的 区 别 。 

2. 同学 之 间 合作 编写 UDP 通信 程序 ,分 别 编写 发 送 端 和 接收 端 代码 ,发送 端 发 送 一 个 
FFF Hello world!1”。 假 设 接收 端 在 计算 机 的 5000 端口 进行 接收 ,并 显示 接收 内 容 。 

3. 简单 介绍 socket 模块 中 用 于 TCP 编程 的 常用 方法 。 

4. 编写 代码 读 取 搜 狐 网 页 首页 内 容 。 

5. 在 自己 的 机 器 上 配置 IIS 以 支持 Python 脚本 的 运行 ,然后 使 用 Python 编写 脚本 ， 
运行 后 在 网 页 上 显示 “Hello world!”。 
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相信 大 家 已 经 很 明显 地 感觉 到 ,这 是 一 个 信息 量 极度 膨胀 的 时 代 , 大 数据 的 概念 自从 提 


出 来 以 后 ， 


迅速 渗透 到 各 行 各 业 。 那 么 到 底 什 么 是 大 数据 呢 ? 历史 上 有 个 著名 的 故事 叫 * 草 


船 借 箭 ” ,故事 的 主人 公 诸 葛 亮 对 天 象 的 观察 实际 上 就 是 对 风云 、 温 度 ,湿度 .光照 和 所 处 节 
气 等 大 量 多 元 化 的 非 结 构 数据 进行 综合 分 析 , 最 终 通 过 复杂 的 计算 得 出 了 正确 的 结论 并 为 
最 终 决策 提供 了 有 力 支 持 , 这 可 以 看 作 是 大 数据 的 一 个 经 典 应 用 。 下 面 引 用 网 上 一 则 小 故 


事 , 也 许 对 


您 理解 大 数据 有 所 帮助 。 


某 比萨 店 的 电话 铃 响 了 ,客服 人 员 拿 起 电话 。 


客服 : 
顾客 : 
客服 : 
顾客 : 
客服 : 


这 是 XX XX 比萨 店 。 您 好 ,请 问 有 什么 需要 我 为 您 服务 ? 

你 好 ,我 想 要 一 份 …… 

先生 ,请 先 把 您 的 会 员 卡 号 告诉 我 。 

16846 146%*% , 

陈 先生 ,您 好 ! 您 是 住 在 泉州 路 一 号 12 1205 室 ,您 家 电话 是 2646xxxx, 您 公 


司 电话 是 4666xxxx, 您 的 手机 是 1391234xxxx。 请 问 您 想 用 哪 一 个 电话 付费 ? 


顾客 : 


顾客 : 
客服 : 
顾客 : 
客服 : 
顾客 : 
客服 : 
顾客 : 
客服 : 
搭桥 手术 ， 
顾客 : 
客服 : 


你 为 什么 要 知道 我 所 有 的 电话 号 码 ? 


: 陈 先生 ,因为 我 们 联机 到 CRM 系统 。 
:我 想 要 一 个 海鲜 比萨 …… 
: 陈 先生 ,海鲜 比萨 不 适合 您 。 


为 什么 ? 

根据 您 的 医疗 记录 ,你 的 血压 和 胆固醇 都 偏 高 。 

那 你 们 有 什么 可 以 推荐 的 ? 

您 可 以 试 试 我 们 的 低 脂 健康 比萨 。 

你 怎么 知道 我 会 喜欢 吃 这 种 的 ? 

您 上 星期 一 在 中 央 图 书馆 借 了 一 本 《 低 脂 健康 食谱 》。 

好 。 那 我 要 一 个 家 庭 特大 号 比萨 ,要 付 多 少 钱 ? 

99 元 ,这 个 足够 您 一 家 六 口吃 了 。 但 您 母亲 应 该 少 吃 ,她 上 个 月 刚刚 做 了 心脏 
还 处 在 恢复 期 。 

那 可 以 刷卡 吗 ? 

陈 先生 ,对 不 起 。 请 您 付 现款 ,因为 您 的 信用 卡 已 经 刷 爆 了 ,您 现在 还 欠 银 行 


4807 元 ,而 且 还 不 包括 房贷 利息 。 


顾客 : 
客服 : 
顾客 : 
客服 : 
顾客 : 


那 我 先 去 附近 的 提 款 机 提 款 。 

陈 先生 ,根据 您 的 记录 ,您 已 经 超过 今日 提 款 限额 。 

算 了 ,你 们 直接 把 比萨 送 我 家 吧 ,家 里 有 现金 。 你 们 多 久 会 送 到 ? 
大 约 30 分 钟 。 如 果 您 不 想 等 ,可 以 自己 骑 车 来 。 

为 什么 ? 
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客服 : 根据 我 们 CRM 全 球 定位 系统 的 车 辆 行驶 自动 跟踪 系统 记录 。 您 登记 有 一 辆 车 
号 为 XX XXX 的 摩托 车 ,而 目前 您 正在 解放 路 东 有 段 华 联 商场 右 侧 骑 着 这 辆 摩托 车 。 

顾客 当即 其 倒 …… 

现 如 今 ,大 数据 的 应 用 比比 皆 是 ,为 各 行 各 业 都 带 来 了 巨大 商机 ,也 提供 了 重要 的 决策 
支持 ,请 看 下 面 的 例子 。 

(1) 洛杉矶 警察 局 和 加 利 福 尼 亚 大 学 合作 利用 大 数据 预测 犯罪 的 发 生 。 

(2) Google 流感 趋势 (Google Flu Trends) 利 用 搜索 关键 词 预测 禽 流 感 的 散布 。 

(3) 统计 学 家 内 特 。 西 尔 弗 (Nate Silver) 利 用 大 数据 预测 了 2012 年 美国 选举 结果 。 

(4) 麻 省 理工 学 院 利 用 手机 定位 数据 和 交通 数据 建立 城市 规划 。 

(5) 梅 西 百货 的 实时 定价 机 制 。 根 据 需 求 和 库存 的 情况 ,该 公司 基于 SAS 的 系统 对 多 
达 7300 万 种 货品 进行 实时 调价 。 

(6) Tipp24 AG 针对 欧洲 博彩 业 构建 的 下 注 和 预测 平台 。 该 公司 用 KXEN 软件 来 分 
析 数 十 亿 计 的 交易 以 及 客户 的 特性 ,然后 通过 预测 模型 对 特定 用 户 进 行动 态 的 营销 活动 。 
这 项 举措 减少 了 90% 的 预测 模型 构建 时 间 。SAP 公司 正在 试图 收购 KXEN。SAP 想 通过 
这 次 收购 来 扭转 其 长 久 以 来 在 预测 分 析 方面 的 劣势 。 

(7) 沃尔玛 的 搜索 。 这 家 零售 业 寡 头 为 其 网 站 自行 设计 了 最 新 的 搜索 引擎 Polaris , 利 
用 语义 数据 进行 文本 分 析 、 机 器 学 习 和 同义词 挖掘 等 。 根 据 沃尔玛 负责 人 的 说 法 ,语义 搜索 
技术 的 运用 使 得 在 线 购物 的 完成 率 提升 了 10% 一 15%。“ 对 沃尔玛 来 说 ,这 就 意味 着 数 十 
亿美 元 的 金额 。” 

(8) 快餐 业 的 视频 分 析 。 该 公司 通过 视频 分 析 等 候 队 列 的 长 度 ,然后 自动 变化 电子 菜 
单 显示 的 内 容 。 如 果 队 列 较 长 , 则 显示 可 以 快速 供给 的 食物 ;如 果 队 列 较 短 , 则 显示 那些 利 
润 较 高 但 准备 时 间 相 对 长 的 食品 。 

目前 在 学 术 界 公认 的 大 数据 四 大 特征 如 下 。 

(1) 数据 量 巨大 。 从 TB 级别 跃 升 到 PB 级 别 甚 至 EB、ZB 级 别 。 

(2) 数据 类 型 繁多 。 非 结构 化 数据 越 来 越 多 .例如 网 络 日 志 、 视 频 、 图 片 和 地 理 位 置信 
息 等 ,这 对 数据 处 理 能 力 提 出 了 更 高 的 要 求 。 

(3) 价值 密度 低 。 例 如 ,在 一 个 小 时 连续 不 间断 的 监控 视频 中 ,真正 有 用 的 数据 很 可 能 
只 有 几 秒 钟 。 如 何 通过 强大 的 机 器 和 高 效 的 算法 更 迅速 地 完成 数据 的 价值 “提纯 ”, 成 为 目 
前 大 数据 背景 下 吸 待 解决 的 难题 和 重要 的 研究 热点 之 一 。 另 外 ,数据 的 来 源 直接 导致 分 析 
结果 的 准确 性 和 真实 性 。 若 数据 来 源 是 完整 的 并 且 是 真实 的 ,最 终 的 分 析 结 果 以 及 决定 将 
更 加 准确 。 

(4) 要 求 处 理 速度 快 。 根 据 IDC 的 “数字 宇宙 ”的 报告 ,预计 到 2020 年 ,全 球 数据 使 用 
量 将 达到 35. 2ZB。 可 以 说 ,在 如 此 海量 的 数据 面前 ,处 理 数据 的 效率 就 是 企业 的 生命 。 


11.1 大 数据 框架 


1. MapReduce 
分 布 式 计 算 框 架 , 可 以 将 单个 大 型 计算 作业 分 配给 多 台 计 算 机 执行 ,可 以 在 短 时 间 内 完 
成 大 量 工作 ,尤其 适合 数值 型 和 标 称 型 数据 ,但 需要 对 行业 领域 具有 一 定理 解 后 重 写 算法 来 
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完成 特定 的 业务 处 理 要求 。MapReduce 的 名 字 由 函数 式 编程 中 常用 的 map 和 reduce 两 个 
单词 组 成 。MapReduce 在 大 量 节点 组 成 的 集群 上 运行 ,工作 流程 : 单个 作业 被 分 成 很 多 小 
份 ,输入 数据 也 被 切片 并 分 发 到 每 个 节点 ,每 个 节点 只 在 本 地 数据 上 做 运算 ,对 应 的 运算 代 
码 称 为 Mapper, 这 个 过 程 即 map 阶段 ;每 个 Mapper 的 输出 通过 某 种 方式 组 合 ,根据 需要 可 
能 再 进行 重新 排序 ,排序 后 的 结果 再 被 切 分 成 小 份 并 分 发 到 各 个 节点 进行 下 一 步 处 理 ,这 个 
过 程 称 为 reduce 阶段 ,对 应 的 代码 称 为 Reducer。 不 同类 型 的 作业 可 能 需要 不 同 数量 的 
Reducer, Jf B. ,在 任何 时 候 , 每 个 Mapper 或 Reducer 之 间 都 不 通信 ,每 个 节点 只 负责 处 理 
自己 的 事务 ,并 且 只 在 分 配 到 本 地 的 数据 集 上 运算 。 

2. Hadoop 

Hadoop 是 MapReduce 框架 的 一 个 免费 开源 实现 ,采用 Java 语言 编写 ,支持 在 大 量 机 
器 上 分 布 式 处 理 数 据 。 除 了 分 布 式 计 算 之 外 ,Hadoop 还 自 带 分 布 式 文件 系统 ,可 以 在 上 面 
运行 多 种 不 同 语言 编写 的 分 布 式 程序 。Hadoop 在 可 伸缩 性 、 健 壮 性 .计算 性 能 和 成 本 上 具 
有 无 可 替代 的 优势 ,事实 上 已 成 为 当前 互联 网 企业 主流 的 大 数据 分 析 平 台 。 

3. Spark 

Spark 是 一 个 针对 超大 数据 集合 的 低 延 迟 集 群 分 布 式 计算 系统 , 比 MapReduce 快 40 
倍 左右 。Spark 是 Hadoop 的 升级 版 本 ,兼容 Hadoop 的 API, 能 够 读 写 Hadoop 的 HDFS 
HBASE 顺序 文件 等 ,与 之 不 同 的 是 将 结果 保存 在 内 存 中 。Hadoop 作为 第 一 代 产 品 使 用 了 
HDFS, 第 二 代 加 入 了 Cache 来 保存 中 间 计 算 结果 ,第 三 代 则 是 Spark 倡导 的 流 技术 


Streaming. 


11.2 MapReduce 编程 案例 


MapReduce 编程 思路 非常 简单 ,首先 对 大 数据 进行 分 割 , 切 分 为 一 定 大 小 的 数据 ;然后 
将 分 割 的 数据 交 给 多 个 Mapper 函数 进行 处 理 ,Mapper 函数 处 理 后 将 产生 一 组 规模 较 小 的 
数据 ,多 个 规模 较 小 的 数据 再 提交 给 Reducer 函数 进行 处 理 , 得 到 一 个 更 小 规模 的 数据 或 最 
终结 果 。 对 于 不 同 的 具体 应 用 ,需要 根据 特定 的 要 求 来 编写 不 同 的 Mapper 和 Reducer 代 
人 码 , 并 且 可 能 会 需要 多 次 迭代 来 最 终 完成 任务 ,如 图 11-1 所 示 。 

了 解 了 基本 原理 以 后 , 接 下 来 我 们 通过 一 个 例子 来 演示 MapReduce 的 应 用 。Windows 
系统 的 升级 日 志文 件 一 般 较 大 , 现 假设 要 求 统计 日 志文 件 中 与 不 同日 期 有 关 的 记录 条 数 。 
首先 将 大 文件 切 分 成 多 个 小 文件 ,然后 对 每 个 小 文件 进行 Map 处 理 , 然 后 对 得 到 的 处 理 结 
果 再 进行 Reduce 处 理 , 最 终 得 到 所 需要 的 数据 和 结论 。 

1. 大 文件 切 分 (FileSplit. py) 


import os 
import os.path 
import time 


def FileSplit (sourceFile, targetFolder) : 
if not os.path.isfile(sourceFile) : # 判 断 文件 是 否 存在 
print (sourceFile, ' does not exist.') 


return 
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切 分 Map Reduce 


文件 1 [一 一 | 结果 1 


SH 


文件 3 -| 


x 
f 
3 
小 
+ 


| 
NY E 


结果 5 


图 11-1 MapReduce 流程 


if not os.path.isdir(targetFolder): — # 切 分 结果 是 多 个 小 文件 ,存放 到 指定 文件 夹 中 
os.mkdir (targetFolder) 


tempData = [] 
number = 1000 # 每 个 小 文件 中 的 记录 条 数 
fileNum =1 # 小 文件 序号 


with open (sourceFile, 'r') as srcFile: 
dataLine =srcFile.readline().strip() 
while dataLine: 
for i in range (number): 
tempData .append (dataLine) 
dataLine =srcFile.readline() 
if not dataLine: 
break 
desFile =os.path.join(targetFolder, sourceFile[0:-4] +str(fileNum) +'.txt') 
with open(desFile, 'at+') as f: 
f£.writelines (tempData) 
tempData = [] 
fileNum =fileNum +1 


if name =='_ main ': 
sourceFile ='test.txt' 
targetFolder ='test' 


FileSplit (sourceFile, targetFolder) 
2. Mapper 代码 (Map. py) 


import os 
import re 

import threading 
import time 


def Map (sourceFile) : 
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if not os.path.exists (sourceFile) : 
print (sourceFile, ' does not exist.') 
return 
pattern =re.compile (r' [0- 9] {1,2}/[0- 9] {1,2}/[0- 9] {4}") # 使 用 正则 表达 式 匹配 日 期 
result = {} 
with open(sourceFile, 'r') as srcFile: 
for dataLine in srcFile: 
r =pattern.findall (dataLine) 
if r: 
t =result.get (r[0], 0) 
tt=1 
result [r[0]] =t 
desFile =sourceFile[0:- 4] +'_map.txt' # 结 果 文 件 
with open (desFile, 'at') as fp: 
for k, v in result.items () : 
fp.write(k+':' +str(v) +'\n') 


if name _ main _': 
desFolder = 'test' 


files =os.listdir(desFolder) 


def Main(i): 
Map (desFolder + '\\' + files[i]) 

fileNumber = len (files) 

for i in range (fileNumber) : 
t =threading.Thread (target =Main, args = (i,)) 
t.start() 


3. Reducer 代码 (Reduce. py) 
import os 


def Reduce (sourceFolder, targetFile): 
if not os.path.isdir (sourceFolder) : 


print (sourceFolder, ' does not exist.') 


return 
result ={} 
# 使 用 列表 推导 式 来 获取 文件 夹 中 的 Mapper 结果 文件 
allFiles = [sourceFolder + ' \ \ ' + f for f in os. listdir (sourceFolder) if 


f.endswith("_map.txt")] 
for f in allFiles: 
with open (f, 'r') as fp: 
for line in fp: 
line =1line.strip() 
if not line: 
continue 
position =line.index(":') 


key =1ine[0:position] 
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value = int (line[position +1:]) 
result [key] = result .get (key,0) + value 
with open(targetFile, 'w') as fp: 
for k,v in result.items(): 
fp.write(k +':' +str (v) +'\n') 


main 


Reduce ('test', 'test\\result.txt') 
保存 并 运行 上 述 程序 ,首先 运行 FileSplit. py, 将 文件 切 分 ,生成 若干 小 文件 ,如 图 11-2 
所 示 。 然 后 运行 Map. py 程序 ,得 到 中 间 结 果 , 如 图 11-3 所 示 。 最 后 运行 Reduce. py 程序 ， 
得 到 最 终结 果 , 如 图 11-4 所 示 。 


if _name 


« Python35 » test 


SEV IAM 帮助 (H) 
By 0 @ 


国 testlLbt = Sj test15.tt 
罩 testzbt ”四 testl6bdt E) 
国 testaet [testit Dt 
[testa [Jtestignt Eltes 
四 test5bdt = Jtest1ott |) tes 
[teste  [jtest20r¢ [ted 日 test3-mapbd 

图 testzbt  [jtest2itt 辐 ted Ltest4.ot 

(Dtest8tt  [Jtest2aet D) “| Litest4_map.tt [testll_map.bd| 


[Dtestant — 国 test23.ot E 国 test5t 日 testl2bd 

[Dtestiont [Jtest24ant D) 国 test5_mepbdt [E] test2_map.od 

轩 testllbt []test25t [tes | i tecti3.nt 

图 testl2bt [P] test26.tt Litest6_map.tt |] test13_map.tet} 

Ditestizot [jtest27nt jt 辐 test7bd 加 testl4bt 

[Dtestiaot [jtest28ot 目 td 
im] 


个 对 


D test7 mapot [)test14 map.bet 
‘w , 
14 WIR 


图 11-2 文件 切 分 结果 图 11-3 运行 Map. py 程序 图 11-4 运行 Reduce. py 
后 的 结果 程序 后 的 结果 


11.3 Hadoop 模式 的 MapReduce 应 用 


仍 以 11.2 节 的 内 容 为 例 , 不 需要 对 大 文件 切 分 ,改写 Map. py 程序 代码 如 下 (文件 名 为 
Hadoop_Map. py): 


import os 
import re 
import time 


def Map (sourceFile) : 
if not os.path.exists (sourceFile) : 
print (sourceFile, ‘does not exist. ') 
return 


pattern=re.compile (r' [0- 9] {1,2}/[0- 9] {1,2}/[0- 9] {4}") 
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result= {} 
with open(sourceFile, 'r') as srcFile: 
for dataLine in srcFile: 
r=pattern. findall (dataLine) 
if r: 
print (r[0], ',", 1) # 将 中 间 结 果 输 出 到 标准 控制 台 
Map('test.txt') 


然后 将 Reduce. py 程序 代码 改写 如 下 (文件 名 为 Hadoop_Reduce. py): 


import os 
import sys 


def Reduce (targetFile): 
result= {} 
for line in sys.stdin: # 从 标准 控制 台中 获取 中 间 结 果 数 据 
riqi, shuliang=line.strip().split(',") 
result [rigi]=result.get (riqi, 0)+1 
with open(targetFile, 'w') as fp: 
for k,v in result.items(): 
fp.write(k +':' +str (v) +"\n') 
Reduce ('result.txt") 
最 后 在 命令 提示 符 环 境 中 执行 下 面 的 命令 : 
python Hadoop map.py test.txt|python Hadoop Reduce.py 
假设 测试 样本 文件 test. txt 在 当前 文件 夹 中 ,命令 执行 结束 后 ,在 当前 文件 夹 生成 结果 
文件 result. txt, 内 容 与 图 11-4 完全 一 致 。 


本 章 小 结 


(1) Amazon、Google 等 很 多 大 公司 都 推出 了 自己 的 大 数据 框架 和 服务 ,比较 流行 的 有 
MapReduce, Hadoop 和 Spark。 

(2) MapReduce 编程 的 思路 : 首先 对 大 数据 进行 分 割 , 切 分 为 一 定 大 小 的 小 数据 ;然后 
将 分 割 的 数据 交 给 多 个 Mapper 函数 进行 处 理 ,Mapper 函数 处 理 后 将 产生 一 组 规模 较 小 的 
数据 ,多 个 规模 较 小 的 数据 再 提交 给 Reducer 函数 进行 处 理 , 得 到 一 个 更 小 规模 的 数据 或 者 
最 终结 果 。 


习 题 


1. 简单 介绍 常见 的 大 数据 处 理 框架 。 
2. 运行 本 章 中 代码 并 理解 MapReduce 编程 思路 。 
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第 12 章 Windows 系统 编程 


Python 是 一 门 强大 的 脚本 语言 , 它 可 以 把 其 他 语言 编写 的 程序 黏合 在 一 起 ,可 以 很 容 
易 地 调用 外 部 程序 ,以 及 调用 其 他 语言 编写 的 动态 链接 库 中 的 代码 ,甚至 还 可 以 将 Python 
程序 打包 为 . exe 可 执行 程序 以 便 在 没有 安装 Python 的 Windows 系统 中 运行 。 在 本 章 中 
通过 大 量 示例 来 介绍 Windows 平台 的 混合 编程 技术 以 及 底层 编程 技术 ,不 过 有 些 内 容 可 能 
需要 读者 对 Windows 平台 有 较 深 层 的 了 解 ,您 可 以 查阅 (Windows 内 核 原理 与 实现 人 
(Windows 核心 编程 《深入 解析 Windows 操作 系统 ) 或 其 他 相关 书籍 。 


12.1 注册 表 编 程 


对 于 Windows 操作 系统 ,注册 表 无 疑 是 非常 重要 的 组 成 部 分 ,Windows 将 几乎 所 有 
软 、 硬 件 系 统 配置 信息 都 保存 在 注册 表 中 。 通 过 读 取 注 册 表 中 的 数据 ,可 以 获取 Windows 
平台 的 相应 信息 ,比如 ,已 安装 的 服务 和 程序 列表 .开机 自动 运行 的 程序 列表 ,文件 类 型 与 程 
序 的 关联 关系 等 :通过 修改 注册 表 中 的 数据 ,可 以 对 Windows 系统 进行 详细 的 配置 。 

Windows 注册 表 有 如 下 5 个 根 键 。 

(1) HKEY_LOCAL_MACHINE (HKLM), 

(2) HKEY_CURRENT_CONFIG (HKCC). 

(3) HKEY_CLASSES_ROOT (HKCR).. 

(4) HKEY_USERS (HKU). 

(5) HKEY_CURRENT_USER (HKCU). 

FK IP MIT aS HL GS THE. CE RP HEP Hl A regedit. exe 并 按 Enter 
键 ,可 以 打开 “注册 表 编 辑 器 "窗口 ,如 图 12-1 所 示 ,在 注册 表 编辑 器 界面 中 可 以 对 注册 表 的 
键 和 值 进行 增 、 删 \ 改 、 查 等 操作 。 

在 注册 表 中 , 值 可 以 为 数值 ,字符 串 等 多 种 类 型 ,详细 类 型 如 表 12-1 所 示 。 

表 12-1 注册 表 中 值 的 类 型 


类 型 名 说 OW 
REG_NONE 没有 类 型 
REG_SZ 字符 串 类 型 
REG_EXPAND_SZ 一 个 可 扩展 的 字符 串 值 ,其 中 可 以 包含 环境 变量 
REG_BINARY 二 进 制 类 型 
DWORD 类 型 ,用 于 存储 32 位 无 符号 整数 , 即 
REG_DWORD / REG_DWORD_LITTLE_ENDIAN | 0~4 294 967 295 之 间 的 整数 , 以 little-endian 
格式 存储 
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续 表 
类 型 名 说 明 
DWORD 类 型 ,用 于 存储 32 位 无 符号 整数 , 即 
REG_DWORD_BIG_ENDIAN O~4 294 967 295 之 间 的 整数 ,以 big-endian 格 
式 存 储 
REG_LINK 到 其 他 注册 表 键 的 链接 ,指定 根 键 或 到 目标 键 
的 路 径 
REG_MULTLSZ ree ern 
REG_RESOURCE_LIST 资源 列表 ,用 于 枚 举 即 插 即 用 硬件 及 其 配置 
REG_FULL_RESOURCE_DESCRIPTOR 资源 标识 符 , 用 于 枚 举 即 插 即 用 硬件 及 其 配置 
REG_RESOURCE_REQUIREMENTS_LIST 资源 需求 列表 ,用 于 枚 举 即 插 即 用 硬件 及 其 配置 
QWORD 类 型 ,用 于 存储 64 位 无 符号 整数 ,以 
REG_QWORD / REG_QWORD_LITTLE_ENDIAN |A le endian 格式 存储 或 未 指定 存储 格式 


XPD ee) EV KREG) EHW 


日 8 我 的 电脑 名 称 关 型 
由 全 HKEY _CLASSES_ROOT Baw REG_SZ 
© torr caan useR 国 neeeateia REG ORD 
@ & rT h) Software\Mi crosoft\VisualStudio\9.... REG _SZ 
B AppEvents 
@ csm 


@ Console 
BE Control Panel 
Environment 
@@ mmc 
DA Identities 
BG Keyboard Layout 
BG Microsoft 
BE Printers 
转生 RICON Aficio MP 1810LD 
@ SessionInfornation 
DA Software 
@@ sist 
图 wacong Program Groups 
@ Volatile Environment 
由 图 HKEY LOCAL MACHINE 
@ @ wer uses 
E HKEY CURRENT _CONFIG 


pp | 
我 的 电脑 NOEY_CURRENT_USER 


图 12-1 注册 表 编辑 器 


对 于 注册 表 编 程 ,可 以 使 用 win32api 模块 和 win32con 模块 ,其 中 win32api 模块 封装 了 
Windows API 函数 ,提供 了 非常 友好 的 接口 。 该 模块 中 常用 的 注册 表 操 作 函 数 有 8 个 。 

(1) RegOpenKey()/RegOpenKeyEx(): 打开 注册 表 。 

(2) RegCloseKey(): 关闭 注册 表 。 

(3) RegQueryValue()/RegQueryValueEx(): 读 取 项 值 。 

(4) RegSetValue()/RegSetValueEx(): 设置 项 值 。 

(5) RegCreateKey()/RegCreateKeyEx(): 添加 项 。 

(6) RegDeleteKey() : 删除 项 。 

(7) RegEnumKey(): 枚 举 子 键 。 

(8) RegDeletetValue(): 删除 值 。 
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例如 ,下 面 的 代码 用 来 查询 注册 表 并 输出 本 机 安装 的 IE 浏览 器 软件 版 本 信息 : 


>>> import win32api 


>>> import win32con 


>>> key= win32api. RegQpenKey (win32con. HKEY LOCAL MACHINE, ' SOFTWARE \ \ Microsoft \ \ Internet 


Explorer", 0,win32con.KEY ALL ACCESS) 


>>> win32api .RegQueryValue (key, '') 


>>> win32api .RegQueryVa_lueEx (key, 'Version") 
("8.0.6001.18702", 1) 


>>> win32api . RegQueryInfoKey (key) 
(64, 12, 130578396029843750L) 
>>> win32api .RegCloseKey (key) 


例 12-1 检查 随 系统 启动 而 启动 的 程序 列表 。 


from win32api import * 


from win32con import * 


def GetValues (fullname): 


if _1 


name= str.split (fullname, '\\',1) 
try: 


if name[0]== 'HKEY LOCAL MACHINE' : 
key= RegOpenKey (HKEY_LOCAL MACHINE, name [1] , 0, KEY_READ) 
elif name[0]== 'HKEY_CURRENT_USER': 
key= RegOpenKey (HKEY_CURRENT_USER, name [1] , 0, KEY_READ) 
elif name[0]== 'HKEY_CURRENT_ROOT': 
key= RegOpenKey (HKEY_CURRENT_ROOT, name [1] , 0, KEY_READ) 
elif name[0]== 'HKEY_CURRENT_CONFIG' : 
key= RegOpenKey (HKEY_CURRENT_CONFIG, name [1] , 0, KEY_READ) 
elif name[0]== "HKEY USERS' : 
key= RegOpenKey (HKEY USERS,name [1] , 0, KEY_READ) 
else: 
Print ('Error, no key named ',name[0]) 
info =RegQueryInfokey (key) 
for i in range(0,info[1]): 
ValueName = RegEnumValue (key, i) 
print (str.1just (ValueName [0], 20) , ValueName[1]) 
RegCloseKey (key) 
except BaseException as e: 


print ("Sth is wrong") 


print (e) 


KeyNames= ["HKEY_ LOCAL MACHINE\\SOFTWARE\\Microsoft\\Windows\\ 
CurrentVersion\\Run', 
"HKEY LOCAL MACHINE\\SOFTWARE\\Microsoft\\Windows\\ 
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CurrentVersion\\RunOnce', 
HKEY_LOCAL MACHINE\\SOFTWARE\\Microsoft\ \Windows\\ 
CurrentVersion\\RunOnceEx", 
"HKEY_CURRENT_USER\\Software\ Microsoft \ \Windows\\ 
CurrentVersion\\Run', 
"HKEY CURRENT USER\\Software\\Microsoft \ \Windows\\ 
CurrentVersion\\RunOnce" ] 
for KeyName in KeyNames: 
print (KeyName) 
GetValues (KeyName) 


操作 Windows 注册 表 的 另外 一 种 常用 方式 是 使 用 Python 模块 winreg, 该 模块 提供 了 
OpenKey()、DeleteKey()、DeleteValue() , CreateKey ( ) 、SetValue()、QueryValueEx()、 
EnumValue() 和 EnumKey() 等 大 量 用 于 注册 表 访问 和 操作 的 方法 。 下 面 的 代码 演示 了 使 
用 模块 winreg 枚 举 注册 表 值 的 用 法 : 

例 12-2 枚 举 注 册 表 。 


import winreg # 在 Python 2.x 中 为 _winreg 
key =winreg.OpenKey (_winreg.HKEY_CURRENT_USER, 
r"Software\Microsoft \Windows\CurrentVersion\Explorer") 
try: 
i=0 
while 1: 
Name, Value, Type =winreg.EnumValue (key, i) 
print (repr (Name), ':', repr (Value), ':', Type) 
it=1 
except WindowsError: 
pass 
print ('=' * 20) 
Name ="FaultTime" 
Value, Type =winreg.QueryValueEx (key, Name) 


print (Name, Value) 


12.2 创建 可 执行 文件 


将 Python 程序 转换 为 . exe 版 本 可 执行 程序 之 后 再 发 布 ,可 以 在 没有 安装 Python 环境 
的 Windows 平台 上 运行 ,这 个 功能 极 大 地 方便 了 用 户 。 为 了 将 Python 程序 转换 为 . exe 可 
执行 文件 ,需要 用 到 py2exe 和 distutils 模块 。 当 然 , 首 先 应 保证 您 编写 的 Python 程序 可 以 
正常 运行 ,并 且 本 机 已 安装 了 所 有 需要 的 扩展 模块 和 相关 的 动态 链接 库 文件 。 

例如 ,将 12. 1 节 最 后 的 代码 保存 为 文件 CheckAndViewAutoRunsInSystem. py, 然 后 
编写 setup. py 文件 ,内 容 为 


import distutils 
import py2exe 
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distutils.core.setup (console= ['CheckAndViewAutoRunsInSystem.py"]) 

最 后 在 命令 提示 符 下 执行 如 下 命令 : 

python setup.py py2exe 

接 下 来 就 会 看 到 控制 台 窗 口中 大 量 的 提示 内 容 飞 快 地 闪 过 ,这 个 过 程 将 自动 搜集 
CheckAndViewAutoRunsInSystem. py 程序 执行 所 需要 的 所 有 支持 文件 ,如 果 创 建成 功 则 
会 在 当前 文件 夹 下 生成 一 个 dist 子 文件 夹 , 其 中 包含 了 最 终 程序 执行 所 需要 的 所 有 内 容 。 
等 待 编译 完成 以 后 ,将 dist 文件 中 的 文件 打包 发 布 即 可 。 例 如 ,上 面 步骤 完成 之 后 ,dist X 
件 夹 中 的 文件 列表 如 图 12-2 所 示 。 


2014/10/6 22:16 PYD 文件 62 KB 


DD bzzpyd 

DD <ypespyd 2014/10/6 22:16 PYD 文件 106 KB 
| O _hashlib.pyd 2014/10/6 22:16 PYD 文件 1,121 KB 
zma.pyd 2014/10/6 22:16 PYD 文件 133 KB 
O -socket.pyd 2014/10/6 22:16 PYD 文件 51KB 
口 ssLpyd 2014/10/6 22:16 PYD 文件 1,689 KB 
C) _win32sysloader.pyd 2014/5/4 3:09 PYD 文件 8 KB 
[E] CheckAndViewAutoRunsInSystemexe 2015/12/26 17:18 应 用 程序 31 KB 
B libraryzip 2015/12/26 17:18 WinRAR ZIP FR... 3,424 KB 
O pyexpat.pyd 2014/10/6 22:16 PYD 文件 166 KB 
[E python34.dil 2015/12/26 17:18 DLL X 3.957 KB 
图 pywintypes34.dll 2014/5/4 3:09 DLL 文件 127 KB 
D select.pyd 2014/10/6 22:16 PYD 文件 11 KB 
C unicodedata.pyd 2014/10/6 22:16 PYD 文件 745 KB 
[O win32api.pyd 2014/5/4 3:09 PYD 文件 122 KB 


图 12-2 dist 文 件 夹 中 的 文件 列表 


py2exe 模块 的 详细 用 法 可 以 查阅 有 关 资 料 ,但 是 对 于 一 般 应 用 而 言 ,上 面 的 代码 已 经 
足够 了 。 唯 一 要 注意 的 问题 是 ,对 于 控制 台 应 用 程序 ,要 想 转换 为 . exe 可 执行 程序 直接 套 
用 上 面 的 代码 框架 即 可 , 仅 需 要 把 

distutils.core.setup (console= ['CheckAndViewAutoRunsInSystem.py']) 

这 行 代 码 中 的 文件 名 蔡 换 为 自己 的 Python 程序 文件 名 即 可 。 对 于 GUI 应 用 程序 , 则 应 该 
将 上 面 代 码 中 的 关键 字 console 修改 为 windows。 

另 一 个 比较 好 用 的 Python 程序 打包 工具 是 pyinstaller, 可 以 通过 pip 工具 安装 。 安 装 
之 后 在 命令 提示 符 环境 中 使 用 命令 “pyinstaller -F-w kousuan. pyw” 即 可 将 Python 程序 
kousuan. pyw 及 其 所 有 依赖 包 打 包 成 为 kousuan. exe 可 执行 文件 ,从 而 脱离 Python 解释 器 
环境 而 独立 运行 于 Windows 系统 。 另 外 ,cx_Freeze 也 是 一 个 很 好 的 打包 工具 。 


12.3 调用 外 部 程序 


1. 使 用 os 模块 的 方法 调用 外 部 程序 


>>> import os 


>>>0s.system('notepad.exe") 
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>>>os.system('notepad C:\\dir.txt') 


使 用 上 面 的 system() 方 法 也 可 以 调用 Windows 系 


E C\Windows\system32\cmd.exe 


统 命令 ,如 dir xcopy 等 ,但 是 有 一 个 缺点 ,不 论 启动 什 || | ee 
么 程序 会 先 启动 一 个 控制 台 窗 口 ,然后 再 打开 被 调 程 SRG 0 
序 ,如 图 12-3 所 示 。 


也 可 以 使 用 os 模块 的 popen() 方 法 来 打开 外 部 程 图 12-3 ”使 用 os 模块 的 system() 


序 , 这 样 不 会 出 现 命令 提示 符 窗口 。 方法 启动 记事 本 


>>> 05.popen (r'C:\windows\notepad.exe") 
<open file 'C:\\windows\\notepad.exe', mode 'r' at 0x012BEF98> 


或 者 ,还 可 以 使 用 os 模块 的 startfile() 方 法 来 打开 外 部 程序 或 文件 ,系统 将 自动 关联 相应 的 
程序 来 打开 或 执行 文件 。 


>>> import os 
>>> os.startfile (r'C:\windows\notepad.exe') 
>>> os.startfile(r'wxIsPrime.py') 


2. 使 用 win32api 模块 调用 ShellExecute() 函数 来 启动 外 部 程序 


>>> import win32api 


>>>win32api.ShellExecute(0, 'open', 'notepad.exe', '', '',0) #0 表 示 后 台 运 行程 序 
>>>win32api.ShellExecute (0, 'open', 'notepad.exe', '', '',1) #1 表示 前 台 运 行程 序 
>>> win32api .ShellExecute (0, 'open', 'notepad.exe', 'C:\\dir.txt', '',1) 

# 传 递 参 数 打开 指定 文件 
>>>win32api.ShellExecute (0, 'open', 'www.python.org',",'',1) # 打 开 网 址 
>>>win32api.ShellExecute (0, 'open',r'C:\dir.txt', '', '',1) # 相 当 于 双击 文件 


使 用 这 种 方式 运行 程序 或 者 打开 文件 时 ,不 会 像 os 模块 的 system ) 方 法 那样 先 打开 


一 个 命令 提示 符 窗口 ,并 且 系 统 将 根据 文件 类 型 自动 关联 相应 程序 并 打开 文件 ,类 似 于 在 资 
源 管理 器 中 双击 打开 文件 或 单 击 打 开 超 链接 。 例 如 ,如 果 打 开 的 是 记事 本 文件 , 则 会 自动 使 
用 记事 本 程序 打开 ;如 果 指 定 的 是 个 域名 , 则 会 自动 使 用 默认 浏览 器 打开 该 网 址 ;如 果 打 开 
的 是 可 执行 文件 , 则 会 自动 打开 并 运行 该 程序 文件 。 
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3. 通过 创建 进程 来 启动 外 部 程序 


>>> import win32process 
>>> handle = win32process. CreateProcess (r ' C: \ windows \ notepad. exe ',", None, None, 0, 
win32process.CREATE_NO WINDOW, None, None, win32process .STARTUPINFO () ) 

# 打 开 记事 本 程序 
>>> win32process.TerminateProcess (handle [0] , 0) # 关 闭 刚才 打开 的 程序 
>>> handle = win32process. CreateProcess (r ' C: \ windows \ notepad. exe ', ' ', None, None, 0, 
win32process.CREATE_NO WINDOW, None, None, win32process.STARTUPINFO() ) 
>>> import win32event 
>>> win32event .WaitForSingleObject (handle[0],-1) # 需 要 手动 关闭 记事 本 
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4. 通过 ctypes 来 调用 动态 链接 库 代 码 

ctypes 是 Python 处 理 动态 链接 库 的 标准 扩展 模块 ,提供 了 与 C 语言 兼容 的 数据 类 型 ， 
允许 在 Python 程序 中 调用 动态 链接 库 或 共享 库 中 的 代码 ,从 而 支持 Python 与 其 他 编程 语 
言 的 混合 编程 ,充分 发 挥 各 自 的 优势 ,大 幅度 提高 开发 效率 和 运行 效率 。 另 外 ,NumPy 模块 
也 提供 了 一 个 函数 numpy. ctypeslib. load_library() 用 来 打开 指定 的 动态 链接 库 并 返回 一 
个 ctypes 对 象 , 通 过 该 对 象 可 以 访问 动态 链接 库 中 的 函数 。 或 者 ,使 用 SciPy 库 的 Weave 
模块 也 可 以 方便 地 将 C++ 程序 以 字符 串 的 形式 嵌入 到 Python 程序 中 。 

ctypes 提供 了 3 种 方法 调用 动态 链接 库 : cdll windll 和 oledll ,它们 的 不 同 之 处 在 于 画 
数 调用 时 的 参数 传递 方式 和 返回 时 栈 的 平衡 方式 。cdll 加 载 的 库 导出 的 函数 必须 使 用 标准 
的 cdecl 调用 约定 (函数 的 参数 从 右 往 左 依次 压 人 栈 内 ,在 函数 执行 完成 后 ,由 函数 的 调用 
者 负责 函数 的 栈 帧 平衡 ), windll 方法 加 载 的 库 导出 的 函数 必须 使 用 stdcall 调用 约定 
(Win32 API 的 原生 约定 ) ,oledll 方法 和 windll 类 似 ,不 过 假设 函数 返回 一 个 HRESULT 
错误 代码 。 

下 面 的 代码 调用 Windows 动态 链接 库 user32. dll 中 的 MessageBoxA() 函 数 来 显示 对 
WHE: 

>>> import ctypes # 通 过 ctypes 可 以 调用 动态 链接 库 中 的 函数 


>>> user32= ctypes .wind11.LoadLibrary ('user32.d11"') 
>>> user32 .MessageBoxA (0, str.encode ("Hello world!'),str.encode ("Python 


ctypes'),0) 
或 者 使 用 下 面 更 为 简洁 的 形式 : 
>>> import ctypes 
>>> ctypes. windl1l. user32. MessageBoxA (0, str. encode (' Hello world! '), str. encode (' Python 
ctypes') , 0) 


下 面 的 代码 调用 标准 C 函数 库 msvert 中 的 printf() 函数 来 输出 文本 ; 


import ctypes 

msvcrt= ctypes.cdll.LoadLibrary ("msvert') 

printf=msvert .wprintf # 在 Python 2.x 中 应 使 用 printf 
Printf('Hello world!') 


或 者 使 用 下 面 形式 : 


import ctypes 

ctypes.cdll .msvcrt .wprintf ("Hello world!') 

该 程序 需要 在 命令 提示 符 环境 中 而 不 是 在 IDLE 中 执行 ,如 果 在 IDLE 环境 中 运行 输 
出 的 是 字符 数量 而 不 是 字符 。 假 设 将 上 面 的 代码 保存 为 useprintfthroughctypes. py 文件 ， 
然后 在 命令 提示 符 中 运行 结果 如 图 12-4 所 示 。 

ctypes 提供 了 与 C 语言 兼容 的 数据 类 型 ,但 在 Python 中 使 用 C 语言 的 结构 体 时 ,需要 
用 类 来 改写 。 表 12-2 给 出 了 基本 类 型 的 对 应 关系 ,关于 结构 体 改写 的 内 容 可 以 通过 后 面 给 
出 的 示例 代码 了 解 大概 思 路 。 
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B 命 $ 担 示 符 — 


jello world? 
\Python35> 


: \Python35>python useprintfthroughct ypes -py 


图 12-4 使 用 ctypes 库 调 用 C 语言 的 printf 函数 


#122 基本 类 型 对 应 关系 


ctypes type C type Python type 
c_bool _Bool bool (1) 
c_char char l-character string 
c_wchar wehar_t 1-character unicode string 
c_byte char int/long 
c_ubyte unsigned char int/long 
c_short short int/long 
c_ushort unsigned short int/long 
c_int int int/long 
c_uint unsigned int int/long 
c_long long int/long 
c_ulong unsigned long int/long 
c_longlong _int64 or long long int/long 
c_ulonglong unsigned __int64 or unsigned long long int/long 
c_float float float 
c_double double float 
c_longdouble long double float 
c_char_p char * (NUL terminated) string or None 
c_wchar_p wehar_t * (NUL terminated) unicode or None 
c_void_p void * int/long or None 


例 12-3 枚 举 进 程 列表 。 


# EnumProcess.py 


from ctypes.wintypes import * 
from ctypes import * 
import collections 


kerne132 =wind11.kerne132 


class tagPROCESSENTRY32 (Structure) : # 定 义 结构 体 
_fields_=[("dwSize', DWORD) , 
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(‘cntUsage", DWORD), 


('th32ProcessID', DWORD), 
('th32DefaultHeapID', POINTER (ULONG) ) , 
('th32ModuleID', DWORD), 
('cntThreads', DWORD), 
('th32ParentProcessID', DWORD), 
("pePriClassBase', LONG), 
(‘dwFlags', DWORD), 
('szExeFile', c char * 260)] 


def enumProcess () : 
hSnapshot = kerne132.CreateToolhelp32Snapshot (15, 0) 
f£ProcessEntry32 = tagPROCESSENTRY32 () 
processClass = collections.namedtuple ("processInfo", "processName processID") 
processSet = [] 
if hSnapshot: 
f£ProcessEntry32.dwSize = sizeof (fProcessEntry32) 
listloop = kerne132.Process32First (hSnapshot, byref (fProcessEntry32) ) 
while listloop: 
processName = (fProcessEntry32.szExeFile) 
processID = fProcessEntry32.th32ProcessID 
processSet .append (processClass (processName, processID) ) 
listloop = kerne132.Process32Next (hSnapshot, byref (fProcessEntry32) ) 
return processSet 
for i in enumProcess(): 


print (i.processName, i.processID) 


12.4 创建 窗口 


例 12-4 可 以 调用 Windows 底层 API 函数 来 创建 窗口 并 构建 消息 循环 。 


import win32gui 
from win32con import 关 
def WndProc (hwnd,msg, wParam, lParam) : 
if msg==WM_PAINT: 
hdc,ps =win32gui.BeginPaint (hwnd) 
rect=win32gui .GetClientRect (hwnd) 
win32gui .DrawText (hdc, 'GUI Python", len ('GUI Python"), rect, 
DT_SINGLELINE | DT_CENTER|DT_VCENTER) 
win32gui .EndPaint (hwnd, ps) 
if msg ==WM_DESTROY: 
win32gui . PostQuitMessage (0) 


return win32gui.DefWindowProc (hwnd, msg, wParam, lParam) 
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we =win32gui .WNDCLASS () 

we. hbrBackground =COLOR_BTNFACE +1 

we.hCursor =win32gui.LoadCursor (0, IDC_ARROW) 
we.hIcon =win32gui.LoadIcon (0, IDI_APPLICATION) 
we.lpszClassName = 'Python on Windows’ 

we. lpfnWndProc =WndProc 


reg =win32gui.RegisterClass (wc) 

hwnd =win32gui .CreateWindow ( 
reg, 'Python', WS_OVERLAPPEDWINDOW, CW_USEDEFAULT, CW_USEDEFAULT, 
CW_USEDEFAULT, CW_USEDEFAULT, 0, 0, 0, None) 

win32gui .ShowWindow (hwnd, SW_SHOWNORMAL) 

win32gui .UpdateWindow (hwnd) 

win32gui . PumpMessages () 


例 12-5 使 用 MFC 创建 窗口 ,并 创建 菜单 。 


import win32ui 
import win32api 
from win32con import * 


from pywin.mfc import window 


class MyWnd (window.Wnd) : 
def init (self): 
window.Wnd. init__(self, win32ui.CreateWnd()) 
self. obj_.CreateWindowEx (WS EX CLIENTEDGE, 
win32ui .RegisterWndclass (0, 0, COLOR WINDOW 1), 
"MEC GUI', WS_OVERLAPPEDWINDOW, 
(10, 10,800,500), None, 0, None) 


self .HookMessage (self .OnRClick, WM_RBUTTONDOWN) 


submenu =win32ui.CreateMenu () 

menu = win32ui.CreateMenu () 

submenu .AppendMenu (MF_STRING, 1051, '&Open') 

submenu .AppendMenu (MF_STRING, 1052, '&Close') 

submenu .AppendMenu (MF_STRING, 1053, '&Save') 

menu.AppendMenu (MF_STRING | MF POPUP, submenu.GetHandle(), '&File') 


submenu =win32ui .CreateMenu () 

submenu .AppendMenu (MF_STRING, 1054, '&Copy') 

submenu .AppendMenu (MF_STRING, 1055, '&Paste') 

submenu .AppendMenu (MF_SEPARATOR, 1056, None) 

submenu .AppendMenu (MF_STRING, 1057, 'C&ut') 

menu.AppendMenu (MF_STRING | MF POPUP, submenu.GetHandle(), '&Edit') 


submenu =win32ui .CreateMenu () 
submenu.AppendMenu (MF_STRING, 1058, 'Tools') 

submenu .AppendMenu (MF_STRING | MF GRAYED, 1059, 'Settings') 

m =win32ui .CreateMenu () 

m.AppendMenu (MF STRING | MF POPUP | MF CHECKED, submenu.GetHandle(), 'Qption') 
menu.AppendMenu (MF_STRING | MF POPUP, m.GetHandle(), '&Other') 


self. obj .SetMenu (menu) 

self .HookCommand (self .MenuClick, 1051) 
self .HookCommand (self.MenuClick, 1052) 
self .HookCommand (self.MenuClick, 1053) 
self.HookCommand(self.MenuClick, 1054) 
self .HookCommand (self .MenuClick, 1060) 


def OnRClick (self,param) : 
submenu =win32ui .CreatePopupMenu () 
submenu .AppendMenu (MF_STRING, 1060, 'Copy') 
submenu .AppendMenu (MF_STRING, 1061, 'Paste') 
submenu .AppendMenu (MF_ SEPARATOR, 1062, None) 
submenu .AppendMenu (MF_STRING, 1063, 'Cut') 
submenu.TrackPopupMenu (param[5], TPM_LEFTALIGN | TPM_LEFTBUTTON | TPM_RIGHTBUTTON, 
self) 


def MenuClick(self, lParam, wParam) : 
if lParam ==1051: 
self .MessageBox('Open', 'Python', MB OK) 
elif lParam ==1053: 
self .MessageBox('Save', 'Python', MB OK) 
elif lParam ==1052: 
self .OnClose() 
elif lParam ==1060 or lParam ==1054: 
self .MessageBox('Copy', 'Python', MB OK) 


def OnClose (self) : 
self.EndModalLoop (0) 


def OnPaint (self) : 
de, ps =self.BeginPaint () 
dc.DrawText ("MFC GUI', self .GetClientRect (), 
DT_SINGLELINE | DT CENTER | DT_VCENTER) 
self.EndPaint (ps) 


w =Mybind () 
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Ww.ShowWindow () 
w.UpdateWindow () 
w.RunModalLoop (1) 


例 12-6 创建 MFC 窗口 并 响应 按钮 消息 。 


import win32ui 
import win32con 


from pywin.mfc import dialog 


class MyDialog (dialog.Dialog) : 

def OnInitDialog (self): 
dialog.Dialog.OnInitDialog (self) 
self.HookCommand (self.OnButton1, 1051) 
self .HookCommand (self .OnButton2, 1052) 

def OnButtonl (self, wPrarm, lParam) : 
win32ui .MessageBox("Buttonl', 'Python', win32con.MB OK) 
# self .EndDialog(1) 

def OnButton2 (self, wParam, lParam) : 
text =self.GetDlgItemText (1054) 
win32ui .MessageBox (text, 'Python', win32con.MB OK) 
# self .EndDialog(1) 


style =win32con.DS_MODALFRAME | win32con.WS_POPUP | win32con.WS_VISIBLE \ 
| win32con.WS_CAPTION | win32con.WS_SYSMENU | win32con.DS_SETFONT 

childstyle =win32con.WS_CHILD | win32con.WS_VISIBLE 

buttonstyle =win32con.WS_TABSTOP | childstyle 


di =['Python', (0,0,300,180), style, None, (8,'MS Sans Serif')] 
Buttonl = (["Button', 'Buttonl', 1051, (80, 150, 50, 14), 
buttonstyle | win32con.BS_PUSHBUTTON] ) 
Button2 = ([{"Button', 'Button2', 1052, (160, 150, 50, 14), 
buttonstyle | win32con.BS_PUSHBUTTON] ) 
Stadic = (['Static', 'Python Dialog', 1053, (130, 50, 60, 14), childstyle]) 
Edit = (['Edit', '', 1054, (130, 80, 60, 14), 
childstyle | win32con.ES_LEFT | win32con.WS_BORDER | win32con.WS_TABSTOP]) 


init = [] 

init .append (di) 

init .append (Button1) 
init .append (Button2) 
init .append (Stadic) 
init .append (Edit) 


mydialog =MyDialog (init) 
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mydialog.DoModal () 


12.5 判断 操作 系统 的 版 本 


某 些 情况 下 ,程序 可 能 依赖 于 特定 版 本 操作 系统 中 的 功能 或 者 希望 程序 在 不 同 版 本 的 
操作 系统 中 有 不 同 的 表现 ,因此 能 够 在 程序 运行 时 获知 操作 系统 的 版 本 就 变 得 非常 有 必要 。 
Python 支持 使 用 多 种 不 同 的 方法 来 获取 操作 系统 的 版 本 信息 。 


>>> import os 

>>> print (os .popen ("ver") .read()) 

Microsoft Windows [版 本 6.1.7601] 

>>> import sys 

>>> print (sys.getwindowsversion ()) 

sys.getwindowsversion (major= 6, minor=1, build= 7601, platform= 2, service_pack= ' Service 

Pack 1") 

>>> import platform 

>>> print (platform.platform()) 

Windows- 7- 6.1.7601- SP1 

Windows 管理 规范 (Windows Management Instrumentation, WMI) £ Windows 的 一 
项 核心 技术 , 它 以 公共 信息 模型 对 象 管理 器 (Common Information Model Object Manager, 
CIMOM) 为 基础 ,是 一 个 描述 Windows 操作 系统 构成 单元 的 对 象 数 据 库 。WMI 是 
Windows 的 核心 组 件 , 通 过 编写 WMI 脚本 和 应 用 程序 可 以 获取 计算 机 系统 、 软 件 和 硬件 信 
息 , 还 可 以 对 计算 机 进行 管理 ,比如 关机 、 重 新 启动 计算 机 等 。 

>>> import wmi 

>>>wmiShell =wmi.WMI () 

>>>print (wmiShell.Win32_OperatingSystem() [0] .Caption) 

Microsoft Windows 7 旗舰 版 

还 可 以 通过 os. system(ver) 语 句 来 查看 Windows 操作 系统 的 版 本 ,但 需要 编写 程序 
并 在 命令 提示 符 环境 中 运行 ,在 IDLE 环境 中 运行 无 法 查看 结果 。 


12.6 系统 运 维 


系统 运 维 涉 及 的 内 容 非 常 广泛 ,包括 文件 系统 数据库 ,用户 账 号 的 维护 ,任务 调度 与 分 
配 ,CPU、 内 存 、 网 络 带 宽 , 硬 盘 空 间 、IP 地 址 等 资源 的 分 配 与 运行 状态 监测 ,等 等 。 第 7 章 
关于 文件 夹 增 量 备份 ,文件 夹 大 小 计算 删除 指定 类 型 文件 和 第 10 章 的 网 络 嗅 探 器 .端口 扫 
描 器 的 案例 都 属于 系统 运 维 范畴 。Python 标准 库 os 提供 了 大 量 可 用 于 系统 运 维 的 函数 ， 
如 表 12-3 所 示 。 另 外 .Python 标准 库 sys platform 以 及 扩展 库 psutil 等 也 提供 了 很 多 支持 
系统 运 维 的 功能 。 
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表 12-3 Python 标准 库 os 中 常用 系统 运 维 函数 


函数 名 功能 说 明 函数 名 功能 说 明 
getewdO 获取 当前 工作 目录 killO 结束 进程 
chdir() 改变 当前 工作 目录 scandir() 遍历 指定 文件 夹 
get_exec_path() 返回 可 执行 文件 搜索 路 cpu_count() 查看 处 理 器 数量 

径 列表 

getlogin() 获取 当前 登录 的 用 户 名 | getpidO 查看 当前 进程 ID 
listdirO 列 出 指定 文件 夹 中 的 所 system() ,startfile() 启动 外 部 程序 或 打开 指定 
ane 有 文件 和 于 文件 夹 TES 文件 
mkdir() .makedirs() | 创建 文件 夹 getppid() 查看 父 进程 ID 
mp ‘rmdir, 删除 文件 ,文件 夹 rename() ,renames() | 重 命名 文件 
removedirs() 


12.6.1 Python 扩展 库 psutil 


跨 平台 的 Python 扩展 库 psutil 可 以 用 来 查询 进程 或 CPU、 内存、 硬盘 以 及 网 络 等 系统 
资源 占用 率 等 信息 ,常用 于 系统 运行 状态 检测 和 维护 ,可 以 使 用 pip 工具 安装 该 库 。 
(D) 查看 CPU 信息 。 


>>>Psutil.cpu_count () # 查 看 CPU 核 数 
>>>psutil.cpu_count (logical=False) # 查 看 物理 cPU 个 数 
>>>psutil.cpu percent () # 查 看 cpu 使 用 率 

>>> psutil.cpu_percent (percpu= True) # 查 看 每 个 cPU 的 使 用 率 
>>>psutil.cpu times () # 查 看 CPU 时 间 分 配 情况 


(2) 查看 开机 时 间 。 


>>> import datetime 

>>>t=psutil.boot time() 

>>> datetime.datetime.fromtimestamp (t) .strftime ('S Y-%m-%d %H:%M:%5S') 
"2015-12-26 11:32:17" 


(3) 查看 内 存 信息 。 


>>> virtual_memory=psutil.virtual_memory() 


>>>virtual_memory.total /1024/1024/1024 # 内 存 总 大 小 
>>>virtual_memory.used/1024/1024/1024 # 已 使 用 内 存 
>>>virtual_memory.free/1024/1024/1024 # 空 间 内 存 

>>> virtual_memory.percent +A FF 

(4) 查看 磁盘 信息 。 

>>>psutil.disk partitions () # 查 看 所 有 分 区 信息 
>>>psutil.disk usage ('c:\\') # 查 看 指定 分 区 的 磁盘 空间 情况 
>>>psutil.disk io counters (perdisk= True) # 查 看 硬盘 读 写 操作 情况 
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(5) 查看 网 络 流量 与 收发 包 信息 。 


>>>psutil.net_io counters () 
(6) 查看 当前 登录 用 户 信息 。 
>>> psutil.users() 

(7) 查看 进程 信息 。 


>>>psutil.pids() 
>>> p=psutil.Process (4204) 
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# 查 看 当前 所 有 进程 id 
# 获 取 指 定 id 的 进程 


>>>p-name () # 进 程 名 

>>> p-username () # 查 看 创建 该 进程 的 用 户 名 
>>>p.cmdline() # 查 看 该 进程 对 应 的 exe 文 件 
>>>p.cwd() # 查 看 该 进程 的 工作 目录 
>>>p.exe() # 进 程 对 应 的 可 执行 文件 名 
>>>p.cpu_affinity () # 该 进程 ceu 占用 情况 (运行 在 哪个 ceu 上 ) 
>>>p.num threads () # 该 进程 包含 的 线程 数量 
>>>p.threads () # 该 进程 所 有 线程 对 象 
>>>p.status () # 进 程 状 态 
>>>p.is_running() # 进 程 是 否 正在 运行 
>>>p.suspend () # 挂 起 

>>>p.resume () # 恢 复 运 行 

>>>p.kill() # 结 束 进 程 


(8) 检查 记事 本 程序 是 否 在 运行 ,如 果 在 运行 则 返回 记事 本 程序 对 应 的 进程 id。 


>>> for id in psutil.pids(): 
try: 
p=psutil.Process (id) 


if os.path.basename (p.exe()) == "notepad.exe': 


print (id) 
except: 


pass 


12.6.2 使 用 pywin32 实现 事件 查看 器 


Windows 系统 会 对 运行 过 程 中 发 生 的 很 多 事情 进行 记录 ,通过 事件 查看 器 可 以 查看 系 
统 日 志 , 常 用 于 计算 机 取证 .事后 调查 责任 定位 以 及 攻击 向 量 分 析 等 ,对 于 服务 器 管理 和 和 运 
行 维护 具有 重要 意义 。Windows 7 操作 系统 中 打开 事件 查看 器 的 步骤 为 : 单 击 “ 开 始 ”菜单 
一 右 击 “计算 机 ?一 ~ 单 击 “ 管 理 ? 莱 单 -~ 单 击 事件 查看 器 ”界面 如 图 12-5 所 示 。 

例 12-7 多 线程 事件 查看 器 。 

下 面 的 代码 使 用 Python+pywin32 编写 ,实现 了 多 线程 事件 查看 器 。 


import win32evtlog 
import win32evtlogutil 
import win32security 
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amm 

2016/2/13 19:42:44 
2016/2/13 19:42:44 
2016/2/13 18:54:02 
2016/2/13 18:40:53 
2016/2/13 18:40:53 
2016/2/13 18:40:22 
2016/2/13 18:35:27 
2016/2/13 18:35:24 
2016/2/13 18:35:23 


12-5 Windows 7 操作 系统 事件 查看 器 


import win32con 


import winerror 


import time 


import re 
import sys 
import traceback 


import threading 


def date2sec(evt_date): 


"把 类 似 于 "6/26/15 15:54:09' 格 式 的 日 期 时 间 字 符 串 转换 为 1970 年 以 来 经 过 的 秒 数 " 
# 把 日 期 和 时 间 分 开 
the date, the_time=evt_date.split() 
(month, day, year)=map (lambda x: int (x), the_date.split(r'/")) 
(hour, minute, second)=map (lambda x: int (x), the_time.split (r':')) 
if 70< year< 100: 

year= year+ 1990 
elif year<50: 

year= year+ 2000 
tup= (year,month, day, hour,minute, second, 0,0, 0) 
seconds= time .mktime (tup) 


return seconds 


def main (computer='.', logtype='System', interval= 480): 
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fllags=win32evtlog-EVENTLOG BACKWARDS READ|\ 
win32evtlog.EVENTLOG SEQUENTIAL READ 


evt_dict={win32con.EVENTLOG AUDIT FAILURE: "审核 失败 事件 
win32con.EVENTLOG AUDIT_SUCCESS:' 审 核 成 功 事件 '， 
win32con.EVENTLOG INFORMATION TYPE:' 通 知事 件 '， 
win32con.EVENTLOG WARNING TYPE:' 警 告 事件 '， 
win32con.EVENTLOG ERROR TYPE: "错误 事件 '} 
begin sec=time.time() 
begin_time=time.strftime('SH:3M:%S',time.localtime (begin sec)) 
try: 
# 打 开 日 志 
hand= win32evtlog.OpenEventLog (computer, logtype) 
except: 
print (" 无 法 打开 "{0}" 服 务 器 上 的 "{1}" 日 志 '.format (computer, logtype) ) 
return 
print (logtype,' events found in the last {0} hours before {1}'. format (interval/60/60, 
begin time)) 
events=1 
while events: 
events= win32evtlog.ReadEventLog (hand, flags, 0) 
for ev_obj in events: 
try: 
the_time=ev_obj.TimeGenerated.Format ('%D %H:%M:%S') 
seconds= date2sec (the time) 
# 只 查看 指定 时 间 段 内 的 日 志 
if seconds <begin_sec- interval: 
break 
computer=ev_obj.ComputerName 
cat= str (ev_obj .EventCategory) 
src= str (ev_obj.SourceName) 
record= str (ev_obj-RecordNumber) 
evt_id= str (winerror.HRESULT_CODE (ev_obj.EventID) ) 
evt type=evt dict [ev_obj.EventType] 
msg=win32evtlogutil.SafeFormatMessage (ev_obj, logtype) 
print (':'.join((the_time, computer, src, cat, record,evt_id,evt_type,msg) )) 
print ('='* 20) 
if seconds <begin_sec- interval: 
break 
except: 
pass 
win32evtlog.CloseEventLog (hand) 


+3+threading. Thread (target=main, args= ('.', ‘Application', 5400) ) 
t3.start () 
3. join() 
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12.6.3 切换 用 户 登 录 身 份 


大 型 服务 器 可 能 会 有 多 个 不 同 权 限 的 管理 员 账 号 ,有 时 可 能 会 需要 在 多 个 账号 之 间 切 
换 , 下 面 的 代码 使 用 pywin32 实现 了 临时 登录 为 另 一 个 账号 的 功能 。 

例 12-8 临时 登录 为 男 一 个 用 户 账号 。 

首先 在 系统 中 创建 一 个 账号 ddddd 并 设置 密码 为 123456, 创 建文 件 夹 D:Ntest_ddd。 


import os 

import win32security 

import win32con 

import win32api 

class Impersonate: 

def init__(self, loginName, password) : 

self .domain= 'WORKGROUP' 
self.loginName= loginName 


self .password= password 


def logon (self) : 
self.handel= win32security. LogonUser (self. loginName, self. domain, self. password, 
in32con.LOGON32_LOGON_INTERACTIVE, win32con.LOGON32_PROVIDER_DEFAULT) 
# 登 录 为 另 一 个 账号 
win32security.ImpersonateLoggedonUser (self .handel) 


def logoff (self): 
# 切 换 至 本 来 的 用 户 名 
win32security.RevertToSelf () 
print ('OK. I am back '+win32api.GetUserName ()) 
# 关 闭 句 柄 
self.handel.Close() 


print ('Origionally I am '+win32api.GetUserName () ) 
# 要 模仿 的 用 户 名 和 密码 
a= Impersonate ('ddddd", '123456') 
try: 
# 以 别人 身份 登录 
a.logon () 
# 显 示 当 前 的 登录 用 户 名 
print ('Now I become '+win32api.GetUserName () ) 
os .mkdir (r"D:\\test_ddd\ddd") 
# 注 销 并 切换 至 本 来 的 用 户 身份 
a.logoff () 
except: 
print ("Denied.Now I will become an administrator and try again") 
a.logoff () 
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os.mkdir (r'D:\test_ddd\administrator") 


运行 上 面 的 代码 ,会 发 现在 文件 夹 D:\test_ddd 中 创建 了 文件 夹 ddd。 接 下 来 删除 刚 
刚 创 建 的 ddd 文件 夹 , 并 设置 文件 夹 D:\test_ddd 的 权限 ,拒绝 账号 ddd 的 任何 操作 。 主 要 
步骤 为 : 右 击 D:\test_ddd 文件 夹 ,在 属性 对 话 框 中 选择 “安全 ”选项 卡 , 然 后 单 击 “ 编 辑 ” 按 
钮 ,依次 单 击 “ 添 加 ”一 “高 级 >“ 立即 查找 ”命令 ,选择 刚刚 创建 的 ddddd 账号 ,然后 设置 权 
限 为 全 部 拒绝 ,如 图 12-6 所 示 。 再 次 运行 上 面 的 代码 ,会 发 现在 D:\test_ddd 文件 夹 中 创 
建 了 子 文件 夹 administrator。 


安全 
对 象 名 称 ; D:\test_ddd 


组 或 用 户 名 (6) 
WB Authenticated Users 
S srst 


MA Administrators Done-PC\Adninistrators) 


ddddd @ONG-PC\ddddd) 
R Users Mong PC\Wsers) 


ano...) 

aaadd 的 权限 E) 允许 拒绝 
完全 控制 [a] q 
修改 回 

读 取 和 执行 回 

列 出 文件 来 内 容 [a] 

读 取 [a] - 
了 部 访问 控制 和 权限 


Cie) (ak) [BW] 
图 12-6 文件 夹 权限 配置 结果 


本 章 小 结 


(1) pywin32 封装 了 Windows 底层 的 几乎 所 有 API 函数 。 

(2) 使 用 ctypes 模块 可 以 调用 任意 其 他 语言 编写 的 动态 链接 库 或 共享 库 文件 。 

(3) 使 用 py2exe 可 以 方便 地 将 Python 程序 转换 为 . exe 程序 。 

(4) 可 以 通过 os 模块 的 system() 、popen() 和 startfile() 等 方法 方便 地 调用 外 部 程序 或 
打开 磁盘 上 的 文件 ,也 可 以 使 用 win32api 模块 的 ShellExecute() 方 法 或 win32process 模块 
的 CreateProcess() 方 法 实现 这 一 目的 。 

(5) ctypes 提供 了 3 种 调用 动态 链接 库 文 件 的 方法 ,分 别 为 cdll、windll 和 oledll, 它 们 
的 不 同 之 处 在 于 调用 函数 时 的 参数 传递 方式 和 函数 返回 时 的 栈 平衡 方式 。 

(6) 在 Windows 平 台 上 ,可 以 通过 sys 模块 的 getwindowsversion() platform 模块 的 
platform() 以 及 wmi 模块 等 多 种 方法 来 动态 检测 系统 版 本 。 

(7) 系统 运 维 涉 及 的 内 容 非 常 广泛 ,包括 文件 系统 数据库 ,用户 账号 的 维护 ,任务 调度 
与 分 配 ,CPU \ 内存、 网络 带宽 .硬盘 空间 、IP 地 址 等 资源 的 分 配 与 运行 监测 ,等 等 。 

(8) Python 标准 库 os、sys、platform 提供 了 大 量 可 用 于 系统 运 维 的 函数 。 

(9) 跨 平台 的 Python 扩展 库 psutil 可 以 用 来 查询 进程 或 CPU 内存、 硬盘 以 及 网 络 等 


281 


《Python 程序 设计 (第 2 版 )》 


系统 资源 占用 率 等 信息 ,常用 于 系统 运行 状态 检测 和 维护 。 

(10) Windows 系统 会 对 运行 过 程 中 发 生 的 很 多 事情 进行 记录 ,通过 事件 查看 器 可 以 查 
看 系统 记录 的 所 有 事件 ,常用 于 计算 机 取证 、 事 后 调查 、 责 任 定位 以 及 攻击 向 量 分 析 等 ,对 于 
服务 器 的 管理 和 运行 维护 具有 非常 重要 的 意义 。 


J3 题 


. 查阅 相关 资料 ,解释 注册 表 几 大 根 键 的 用 途 。 

. 选择 一 个 编写 好 的 Python 程序 ,将 其 转换 为 . exe 可 执行 文件 。 

. 编写 代码 ,使 用 至 少 3 种 不 同 的 方法 启动 Windows 自 带 的 计算 器 程序 。 
. 编写 代码 ,检测 本 机 操作 系统 版 本 。 


a wunne 
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第 13 章 多 线程 与 多 进程 编程 


由 于 硬件 技术 的 飞速 发 展 ,早期 的 多 核 , 多 处 理 器 等 高 端 技术 已 经 走 进 了 普通 家 庭 ,再 
加 上 内 存 、 主 频 、 硬 盘 等 各 种 硬件 配置 的 飞速 提高 ,大 幅度 提高 了 普通 PC 的 运算 速度 和 数 
据 处 理 能 力 。 在 多 核 , 多 处 理 器 平台 上 ,每 个 核 可 以 运行 一 个 线程 ,多 个 线程 同时 运行 并 相 
互 协作 ,从 而 达到 高 速 处 理 任务 的 目的 。 

然而 ,即使 是 高 端 服务 器 或 工作 站 甚至 集群 系统 ,处 理 器 和 核 的 数量 总 是 有 限 的 ,如 果 
线程 的 数量 多 于 核 的 数量 ,就 必然 需要 调度 。 在 调度 时 ,处 理 器 为 每 个 线程 分 配 一 个 很 短 的 
时 间 片 ,所 有 线程 根据 具体 的 调度 算法 轮流 获得 该 时 间 片 。 当 时 间 片 用 完 以 后 ,即使 该 线程 
还 没有 执行 完 也 要 退出 处 理 器 并 等 待 下 次 调度 。 由 于 处 理 器 中 寄存 器 的 数量 有 限 ,而 不 同 
的 线程 很 可 能 需要 使 用 到 相同 的 一 组 寄存 器 来 保存 中 间 计 算 结果 或 当前 状态 。 因 此 ,在 调 
度 线程 时 必须 做 好 上 下 文保 存 和 恢复 工作 ,以 保证 该 线程 下 次 被 调度 进 处 理 器 后 能 够 继续 
上 次 的 工作 。 虽 然 这 些 工作 并 不 需要 Python 程序 员 操 心 ,但 是 我 们 必须 清楚 的 一 件 事 是 ， 
并 不 是 使 用 的 线程 数量 越 多 越 好 ,如 果 线 程 太 多 ,线程 调度 带 来 的 开销 可 能 会 比 线程 实际 执 
行 的 开销 还 大 ,这 样 使 用 多 线程 就 失去 本 来 的 意义 了 。 


13.1 threading 模块 


threading 模块 是 Python 支持 多 线程 编程 的 重要 模块 ,该 模块 是 在 底层 模块 _thread 的 
基础 上 开发 的 更 高 层次 的 线程 编程 接口 ,提供 了 大 量 的 方法 和 类 来 支持 多 线程 编程 , 极 大 地 
方便 了 用 户 。threading 模块 常用 方法 如 表 13-1 所 示 。 


表 13-1 threading 模块 常用 方法 
方 法 功能 说 明 


threading. active_count() 返回 当前 处 于 alive 状态 的 Thread 对 象 数量 


threading. current_thread() | 返回 当前 Thread 对 象 
返回 当前 线程 的 线程 标识 符 。 线 程 标识 符 是 一 个 非 负 整 数 ,并 无 特殊 含 


threading. get_ident() 义 , 只 是 用 来 标识 线程 ,该 整数 可 能 会 被 循环 利用 。Python 3. 3 及 以 后 版 
本 支持 该 方法 

threading. enumerate() 返回 当前 处 于 alive 状态 的 所 有 Thread 对 象 列 表 
返回 主线 程 对 象 , 即 启动 Python 解释 器 的 线程 对 象 。Python 3. 4 及 以 后 


threading. main_thread() 


版 本 支持 该 方法 

返回 创建 线程 时 使 用 的 栈 的 大 小 ,如 果 指 定 size 参数 , 则 用 来 指定 后 续 创 
threading. stack_size([size]) | 建 的 线程 使 用 的 栈 大 小 ,size 必须 是 0 表示 使 用 系统 默认 值 ) 或 大 于 32K 
的 正 整 数 
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下 面 的 代码 简单 演示 了 该 模块 方法 的 用 法 : 


>>> import threading 


>>>threading.stack size() # 查 看 当前 线程 栈 的 大 小 
>>>threading.stack size(64* 1024) # 设 置 当 前 线程 栈 的 大 小 
>>> threading.active_count () +AA A Boe 
>>> threading.current_thread() # 当 前 线程 对 象 

>>> threading.enumerate () ## 当 前 活动 线程 对 象 列 表 


13.2 Thread 对 象 


threading 模块 提供 了 Thread, Lock, RLock, Condition, Event, Timer 和 Semaphore 等 
大 量 类 来 支持 多 线程 编程 ,Thread 是 其 中 最 重要 也 是 最 基本 的 一 个 类 ,可 以 通过 该 类 创建 


线程 并 控制 线程 的 运行 。 


Thread 类 支持 使 用 两 种 方法 来 创建 线程 : 一 种 方法 是 为 构造 函数 传递 一 个 可 调用 对 
象 ; 另 一 种 方法 是 继承 Thread 类 并 在 派生 类 中 重 写 _init_() 和 run() 方 法 。 创 建 线程 对 象 
以 后 ,可 以 调用 其 start() 方 法 来 启动 ,该 方法 自动 调用 该 类 对 象 的 run() 方 法 ,此 时 该 线程 
处 于 alive 状态 ,直至 线程 的 run() 方 法 运行 结束 。Thread 对 象 成 员 如 表 13-2 所 示 。 


表 13-2 Thread 对 象 成 员 


成 员 说 明 
start() 自动 调用 run() 方 法 ,启动 线程 ,执行 线程 代码 
aie 线程 代码 ,用 来 实现 线程 的 功能 与 业务 逻辑 ,可 


以 在 子 类 中 重 写 该 方法 来 自 定义 线程 的 行为 


—init_ (self, group = None, target = None, name = 
None, args= © ,kwargs= None, verbose= None) 


构造 函数 


name 


用 来 读 取 或 设置 线程 的 名 字 


ident 


线程 标识 , 非 0 数字 或 None( 线 程 未 被 启动 ) 


is_alive() \isAlive() 


测试 线程 是 否 处 于 alive 状态 


daemon 


布尔 值 ,表示 线程 是 否 为 守护 线程 


join(timeout= None) 


等 待 线程 结束 或 超时 返回 


13.2.1 Thread 对 象 中 的 方法 


(1) join([timeout]): 阻塞 当前 线程 ,等 待 被 调 线程 结束 或 超时 后 再 继续 执行 当前 线程 
的 后 续 代 码 ,参数 timeout 用 来 指定 最 长 等 待 时 间 ,单位 为 秒 。 


例 13-1 创建 多 线程 。 


import threading 
import time 
def funcl (x, y): 
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for i in range (x, y): 
print (i, end=") 
time.sleep (10) 


tl=threading.Thread (target =funcl, args = (15, 20)) 
tl.start () 

t1.join (5) 

t2= threading. Thread (target =funcl, args = (5, 10)) 
t2.start () 


保存 并 运行 上 面 的 程序 将 会 发 现 , 首 先 输出 15 ~ 19 这 5 个 整数 ,然后 程序 暂停 , 几 秒 钟 
以 后 又 继续 输出 5 一 9 这 5 个 整数 。 如 果 将 tl.join(5) 这 一 行 注释 掉 再 运行 ,两 个 线程 的 输 
出 将 会 重 和 至 在 一 起 ,这 是 因为 两 个 线程 并 发 运行 ,而 不 是 第 一 个 结束 以 后 再 运行 第 二 个 。 可 
以 说 ,这 是 线程 同步 的 一 个 最 简单 的 形式 。 当 然 , 还 可 以 把 time. sleep(10) 这 一 行 注释 掉 再 
运行 ,会 发 现 两 个 线程 的 输出 之 间 没 有 时 间 间 隔 ,您 能 明白 其 中 的 原因 吗 ? 

(2) isAlive(): 测试 线程 是 否 处 于 运行 状态 。 

Pl 13-2 查看 线程 状态 。 


import threading 
import time 
def funcl (x, y): 
for i in range (x, y): 
print (i) 
#time.sleep (10) 


tl= threading. Thread (target =funcl, args = (15, 20)) 


tl.start() 

t1.join (5) # 注 释 掉 这 里 试 试 

t2= threading.Thread (target =funcl, args = (5, 10)) 
t2.start() 

2. join() # 注 释 掉 这 里 试 试 


print ('tl:',tl.isAlive()) 

print ('t2:',t2.isAlive()) 

运行 上 面 的 程序 会 发 现 ,最 后 两 个 的 输出 都 是 False, 即 两 个 线程 都 执行 完了 。 如 果 将 
tl.join(5) 这 一 行 注释 掉 会 发 现 最 后 两 行 的 输出 结果 没有 变化 ,这 是 因为 t2. join() 这 一 行 
代码 会 阻塞 当前 程序 直至 线程 t2 运行 结束 ,对 于 本 例 中 的 线程 tl 基本 也 运行 结束 了 。 如 
果 将 线程 tl 的 参数 范围 增 大 则 会 发 现 , 倒 数 第 二 行 的 输出 结果 很 可 能 会 变 为 True, 


13.2.2 Thread 对 和 象 中 的 daemon 属性 
在 脚本 运行 过 程 中 有 一 个 主线 程 , 若 在 主线 程 中 创建 了 子 线程 ,当主 线程 结束 时 根据 子 
线程 daemon 属性 值 的 不 同 可 能 会 发 生 下 面 的 两 种 情况 之 一 : 四 当 某 子 线程 的 daemon 属 


性 为 False 时 ,主线 程 结束 时 会 检测 该 子 线程 是 否 结束 ,如 果 该 子 线程 尚未 完成 , 则 主线 程 
会 等 待 它 完成 后 再 退出 ; @@ 当 某 子 线程 的 daemon 属性 为 True 时 ,主线 程 运行 结束 时 不 对 
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该 子 线程 进行 检查 而 直接 退出 ,同时 所 有 daemon 值 为 True 的 子 线程 将 随 主线 程 一 起 结 
束 , 而 不 论 是 否 运 行 完成 。daemon 属性 的 值 默认 为 False, 如果 需要 修改 , 则 必须 在 调用 
start() 方 法 启动 线程 之 前 修改 。 


以 上 论述 不 适用 于 IDLE 环境 中 的 交互 模式 或 脚本 运行 模式 ,因为 在 该 环境 中 的 主线 


程 只 有 在 退出 Python IDLE 时 才 终 止 。 


示 ， 


例 13-3 线程 的 daemon 属性 。 


import threading 
import time 


class mythread (threading.Thread) : 
def init__(self, num, threadname) : 
threading.Thread.__init_ (self, name = threadname) 
self.num =num 
#self.daemon =True 
def run (self): 
time.sleep (self.num) 


print (self .num) 


tl =mythread(1, 't1') 
t2 =mythread(5, 't2"') 
t2.daemon = True 
print (t1.daemon) 
print (t2.daemon) 
tl.start() 


t2.start() 


将 上 面 的 代码 存储 为 ThreadDaemon. py 文件 ,在 IDLE 环境 中 运行 结果 如 图 13-1 所 
在 命令 提示 符 环境 中 运行 结果 如 图 13-2 所 示 o 


=\Python35>python threaddaemon.py 


=== RESTART ace 
rue 
=\Python35> 
图 13-1 ThreadDaemon. py 程序 在 IDLE 图 13-2 ThreadDaemon. py 程序 在 命令 提示 
环境 中 的 运行 结果 符 环境 中 的 运行 结果 


派生 自 Thread 类 的 自 定义 线程 类 首先 也 是 一 个 普通 类 ,同时 还 拥有 线程 类 特有 的 run()、 


start() join() 等 一 系列 方法 ,也 可 以 在 线程 类 中 定义 普通 方法 并 通过 线程 对 象 来 调用 。 
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例 13-4 调用 线程 对 象 的 普通 方法 。 


import threading 
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import time 


class myThread (threading.Thread) : 
def init (self, threadName): 
threading-Thread. init__(self) 


self .name= threadName 


def run (self) : 
time.sleep (1) 


print ("In run:', self.name) 


def output (self) : # 在 线程 类 中 定义 普通 方法 


print ('In output:', self.name) 


t=myThread ('test') 

t.start() 

t.output () # 调 用 普通 方法 
time.sleep (2) 


print ('OK') 


13.3 线程 同步 技术 


这 无 疑问 ,多 线程 是 为 了 充分 利用 硬件 资源 尤其 是 CPU 资源 来 提高 任务 处 理 速度 和 
效率 的 技术 。 将 任务 拆 分 成 互相 协作 的 多 个 线程 同时 运行 ,那么 属于 同一 个 任务 的 多 个 线 
程 之 间 必 然 会 有 交互 和 同步 以 便 互 相 协作 地 完成 任务 。 另 外 ,还 可 以 使 用 多 线程 来 为 用 户 
提供 很 多 的 方便 。 例 如 ,打开 软件 时 可 能 需要 加 载 大 量 的 模块 和 库 , 这 可 能 需要 较 长 的 时 
间 ,此 时 可 以 使 用 一 个 线程 来 显示 一 个 小 动画 来 表示 当前 软件 正在 启动 ,而 当 后 台 线程 加 载 
完 所 有 的 模块 和 库 之 后 ,结束 该 动画 的 播放 并 打开 软件 主 界面 ,这 是 多 线程 同步 的 一 个 典型 
应 用 。 再 如 , 字 处 理 软件 可 以 使 用 一 个 线程 来 接受 用 户 键盘 输入 ,而 使 用 一 个 后 台 线程 来 进 
行 拼写 检查 以 及 字数 统计 之 类 的 功能 并 实时 将 结果 显示 在 状态 栏 上 ,这 无 疑 会 极 大 方便 用 
户 的 使 用 ,对 于 提高 用 户 体验 有 重要 帮助 。 

Python 的 threading 模块 提供 了 多 种 用 于 线程 同步 的 对 象 , 在 本 节 中 将 一 一 介绍 。 


13.3.1 Lock/RLock 对 象 


Lock 是 比较 低级 的 同步 原 语 , 当 被 锁定 以 后 不 属于 特定 的 线程 。 一 个 锁 有 两 种 状态 : 
locked 和 unlocked。 如 果 锁 处 于 unlocked 状态 ,acquire() 方 法 将 其 修改 为 locked 并 立即 返 
回 ;如 果 锁 已 处 于 locked 状态 , 则 阻塞 当前 线程 并 等 待 其 他 线程 释放 锁 ,然后 将 其 修改 为 
locked 并 立即 返回 。release() 方 法 用 来 将 锁 的 状态 由 locked 修改 为 unlocked 并 立即 返回 , 
如 果 锁 状态 本 来 已 经 是 unlocked, 调 用 该 方法 将 会 抛 出 异常 。 

可 重 入 锁 RLock 对 象 也 是 一 种 常用 的 线程 同步 原 语 , 可 被 同一 个 线程 acquire() 多 次 。 
当 处 于 locked 状态 时 , 某 线 程 拥 有 该 锁 ; 当 处 于 unlocked 状态 时 ,该 锁 不 属于 任何 线程 。 
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RLock 对 象 的 acquire()/release() 调 用 对 可 以 嵌 套 , 仅 当 最 后 一 个 或 者 最 外 层 的 release() 
执行 结束 后 , 锁 才 会 被 设置 为 unlocked 状态 。 
例 13-5 使 用 Lock/RLock 对 象 实现 线程 同步 。 


import threading 
import time 
class mythread (threading. Thread) : 
def init (self): 
threading.Thread. init (self) 
def run (self): 
global x 
lock.acquire() 
for i in range (3): 
x=xti 
time.sleep (2) 
print (x) 
lock. release () 
lock =threading.RLock() # lock =threading.Lock() 
tl=[] 
for i in range (10) : 
t =mythread () 
tl.append (t) 
x=0 
for i in tl: 


i.start() 


13.3.2 Condition 对 象 


使 用 Condition 对 象 可 以 在 某 些 事件 触发 后 才 处 理 数 据 , 可 以 用 于 不 同 线程 之 间 的 通 
信 或 通知 ,以 实现 更 高 级 别 的 同步 。Condition 对 象 除了 具有 acquire() 和 release() 方 法 之 
外 ,还 有 wait() .notify() 和 notify_all() 等 方法 。 下 面 通过 经 典 生产 者 -消费 者 问题 来 演示 
Condition 对 象 的 用 法 。 

例 13-6 ”使 用 Condition 对 象 实现 线程 同步 。 

首先 实现 生产 者 线程 类 : 


import threading 


class Producer (threading.Thread) : 
def init__(self, threadname) : 
threading.Thread. init _(self,name=threadname) 
def run (self) : 
global x 
con.acquire () 
if x==20: 


con.wait () 
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else: 
print ("\nProducer:', end='') 
for i in range (20): 
print (x, end='') 
x=x +1 
print (x) 
con.notify() 


con.release () 
接 下 来 实现 消费 者 线程 类 : 


class Consumer (threading.Thread) : 
def init__(self, threadname) : 
threading.Thread. init__(self, name =threadname) 
def run (self): 
global x 
con.acquire () 


0: 


if x 
con.wait () 
else: 
print ('\nConsumer:', end='') 
for i in range (20): 
print (x, end='') 
x=x-1 
print (x) 
con.notify() 


con.release () 
创建 Condition 对 象 以 及 生产 者 线程 和 消费 者 线程 。 


con =threading.Condition () 
x=0 

p = Producer ("Producer") 

c =Consumer ("Consumer") 
p.start () 

c.start() 

p-join () 

c.join() 


print ("After Producer and Consumer all done:"',x) 


该 程序 的 运行 结果 如 图 13-3 所 示 。 


>>> 
>>> 


RESTART 


Producer: 0 1 234567 8910 11 12 13 14 15 16 17 18 19 20 


Consumer: 20 19 18 17 16 15 14 13 12 11 109876543210 


[After Producer and Consumer all done: 0 


图 13-3 使 用 Condition 实现 线程 同步 
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13.3.3 queue WR 


queue 模块 (在 Python 2 中 为 Queue 模块 ) 实 现 了 多 生产 者 -多 消费 者 队列 ,尤其 适合 
需要 在 多 个 线程 之 间 进 行 信息 交换 的 场合 ,该 模块 的 queue 对 象 实现 了 多 线程 编程 所 需要 
的 所 有 锁 语 义 。 


import threading 
import time 
import queue # Queue in Python 2 


class Producer (threading.Thread) : 
def init__(self, threadname) : 
threading.Thread.__init__ (self, name = threadname) 
def run (self): 
global myqueue 
myqueue .put (self .getName () ) 
print (self.getName(), ' put ', self.getName(), ' to queue.') 


class Consumer (threading.Thread) : 
def init__(self, threadname) : 
threading.Thread. init__(self, name =threadname) 
def run (self): 
global myqueue 
print (self.getName(), ' get ', myqueue.get(), ' from queue.') 
myqueue = queue .Queue () 
plist =[] 
clist =[] 


for i in range(10): 
p =Producer ('Producer' + str (i)) 
plist.append (p) 
c =Consumer ('Consumer' + str(i)) 


clist.append (c) 


for i in plist: 
i.start () 
i.join() 

for i in clist: 
i.start() 


i.join() 


13.3.4 Event 对 象 


Event 对 象 是 一 种 简单 的 线程 通信 技术 .一 个 线程 设置 Event 对 象 , 另 一 个 线程 等 待 
Event 对 象 。Event 对 象 的 set() 方 法 可 以 设置 Event 对 象 内 部 的 信号 标志 为 真 ;clear() 方 
法 可 以 清除 Event 对 象 内 部 的 信号 标志 ,将 其 设置 为 假 :isSet() 方 法 用 来 判断 其 内 部 信号 标 
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志 的 状态 ;wait() 方 法 只 有 在 其 内 部 信号 状态 为 真 时 将 很 快 地 执行 并 返回 , 若 Event 对 象 的 
内 部 信号 标志 为 假 , wait() 方 法 将 一 直 等 待 至 超时 或 内 部 信号 状态 为 真 。 
例 13-7 使 用 Event 对 象 实现 线程 同步 。 


import threading 
class mythread (threading.Thread) : 
def init (self, threadname): 
threading.Thread. init (self, name =threadname) 
def run (self) : 
global myevent 
if myevent .isSet () : 
myevent .clear () 
myevent .wait () 
print (self.getName ()) 
else: 
print (self .getName ()) 
myevent .set () 


myevent = threading .Event () 
myevent .set () 
tl=[] 
for i in range (10): 
t =mythread (str (i)) 
tl.append (t) 


for i in tl: 
i.start () 


将 上 面 的 代码 保存 为 ThreadSynchronizationUsingEvent. py 文件 并 运行 ， 
结果 略 有 不 同 , 图 13-4 是 其 中 一 次 的 运行 结果 。 


a 
A 
x 
号 
mi 

=. 
at 


国 命令 提示 符 


= \Python35>python ThreadS ynchronizat ions ingEvent .py 


= \Python35> 


图 13-4 使 用 Event 对 象 实现 线程 同步 


13.4 多 进程 编程 


Python 标准 库 multiprocessing 支持 使 用 类 似 于 threading 的 用 法 来 创建 与 管理 进程 ， 
并 且 避 免 了 GIL(Global Interpreter Lock) 问 题 , 可 以 更 有 效 地 利用 CPU 资源 。 
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13.4.1 创建 进程 


与 使 用 threading 创建 和 启动 线程 类 似 , 可 以 通过 创建 Process 对 象 来 创建 一 个 进程 并 
通过 调用 进程 对 象 的 start() 方 法 来 启动 。 


from multiprocessing import Process 


import os 


def f (name): 


print ('module name:', name ) 


print ("parent process:', os.getppid()) # 查 看 父 进程 ID 
print ('process id:', os.getpid()) # 查 看 当前 进程 ID 


print ('hello', name) 


if name =='_main_': 
p= Process (target=f, args= ('bob',)) 
p.-start () 
p-join() 


multiprocessing 还 提供 了 Pool 对 象 支持 数据 的 并 行 操作 。 例 如 ,下 面 的 代码 可 以 并 发 
计算 二 维 数组 每 行 的 平均 值 。 


from multiprocessing import Pool 


from statistics import mean 


def f(x): 


return mean (x) 


if name =='_main_': 
x= [list (range (10)), list (range (20,30)), list (range (50, 60)), list (range (80, 90) ) ] 
with Pool (5) as p: 
print (p.map (f, x)) 


13.4.2 进程 间 数 据 交 换 
例 13-8 使 用 Queue 对 象 在 进程 间 交 换 数 据 。 


import multiprocessing as mp 


def foo(q): 


q-put ("hello world! ') 


if __name ==' main ': 


mp.set_start_method ("spawn") #Windows 系统 创建 子 进程 的 默认 方式 
q=mp.Queue () 


p=mp.Process (target= foo, args= (q,)) 
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p.start () 
p-join() 
print (q.get()) 


也 可 以 使 用 上 下 文 对 象 context 的 Queue 对 象 实现 进程 间 的 数据 交换 。 


import multiprocessing as mp 


def foo(q): 


if name == 


例 13-9 


q.-put ("hello world') 


ctx=mp.get_context ("spawn") 
q=ctx.Queue () 

p=ctx.Process (target= foo, args= (q,)) 
p.-start () 

p-join() 


print (q.get()) 


使 用 管道 实现 进程 间 数据 交换 。 


from multiprocessing import Process, Pipe 


def f (conn) : 


if 


例 13-10 


conn.send ("hello world') 
conn.close() 

==" main "s 

parent_conn, child_conn= Pipe () 

p= Process (target=f, args= (child_conn,)) 
p.start () 

print (parent_conn.recv()) 


p.-join() 


使 用 共享 内 存 实现 进程 间 数 据 交换 。 


from multiprocessing import Process, Value, Array 


def f(n, a): 


if name == 


n.value=3.1415927 
for i in range(len(a)): 


ali]=a[i] * ali] 


main ': 
num=Value('d', 0.0) # 实 型 
arr=Array('i', range (10)) # 整 型 数组 


p=Process (target=£, args= (num, arr)) 


p-start () 


# 向 管道 中 发 送 数据 


# 创 建 管道 对 象 
# 将 管道 的 一 方 作为 参数 传递 给 子 进程 


# 通 过 管道 的 另 一 方 获取 数据 
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p-join() 
print (num.value) 


print (arr[:]) 


例 13-11 使 用 Manager 对 象 实现 进程 间 数 据 交换 。 

Manager 对 象 控制 一 个 拥有 list、dict、Lock、RLock、Semaphore、 BoundedSemaphore、 
Condition, Event, Barrier , Queue, Value, Array, Namespace 等 对 象 的 服务 端 进 程 , 并 且 人 允许 
其 他 进程 访问 这 些 对 象 。 


from multiprocessing import Process, Manager 


def f(d, 1, t): 
d['name']= 'Dong Fuguo' 
d['age']=38 
d['sex']= 'Male" 
d['affiliation']='SDIBT' 
l.reverse () 
t.value=3 
if name =='_main _': 
with Manager () as manager: 
d=manager.dict () 
l=manager.list (range (10) ) 
t=manager.Value('i', 0) 
p= Process (target=f, args= (d, 1, t)) 
p.start() 
p-join() 
for item in d.items(): 
print (item) 
print (1) 


print (t.value) 


13.4.3 进程 同步 


在 需要 协同 工作 完成 大 型 任务 时 ,多 个 进程 间 的 同步 非常 重要 。 进 程 同步 方法 与 线程 
同步 方法 类 似 , 代 码 稍微 改写 一 些 即 可 ,本 节 以 Lock 对 象 和 Event 对 象 为 例 简单 演示 其 
用 法 。 

例 13-12 使 用 Lock 对 象 实现 进程 同步 。 


from multiprocessing import Process, Lock 


def £(1, i): 
l.acquire () # 获 取 锁 
try: 

print ("hello world', i) 
finally: 
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1.release() 考释 放 锁 
if _name ==" main ': 
lock=Lock () + OE MR 


for num in range (10) : 


Process (target=f, args= (lock, num)).start () 
例 13-13 使 用 Event 对 象 实现 进程 同步 。 


from multiprocessing import Process, Event 


def f(e, i): 
if e.is_set(): 
e.wait () 
print ("hello world", i) 
e.clear() 
else: 


e.set () 


if name =='_main_': 
e=Event () 
for num in range (10) : 


Process (target=f, args= (e,num)) .start () 


AS 章 小 结 


(1) 线程 数量 并 不 是 越 多 越 好 。 

(2) threading 模块 是 Python 支持 多 线程 编程 的 重要 模块 ,提供 了 Thread、 Lock、 
RLock、Condition、Event、Timer、Semaphore 等 大 量 类 和 对 象 。 

(3) Thread 类 支持 两 种 方法 来 创建 线程 : 一 种 方法 是 为 其 构造 函数 传递 一 个 可 调用 对 
象 ; 男 一 种 方法 是 继承 Thread 类 并 在 派生 类 中 重 写 _init_QO 〇 和 runO 〇 方法。 

(A) 创建 了 线程 对 象 之 后 ,可 以 调用 其 start() 方 法 来 启动 该 线程 ,join() 方 法 用 来 等 待 
线程 结束 或 超时 。 

(5) 可 以 通过 设置 线程 的 daemon 属性 来 决定 主线 程 结束 时 是 否 需 要 等 待 子 线程 结束 ， 
daemon 属性 的 值 默认 为 False, 即 主线 程 结束 时 检查 并 等 待 子 线程 结束 ,如 果 需 要 修改 
daemon 属性 的 值 则 必须 在 调用 start() 方 法 之 前 进行 修改 。 

(6) 除了 threading 模块 中 提供 的 线程 同步 对 象 之 外 ,Queue 或 queue 模块 也 实现 了 多 
生产 者 -多 消费 者 队列 ,尤其 适合 需要 在 多 个 线程 之 间 进 行 信息 交换 的 场合 。 

(7) 派生 自 Thread 类 的 自 定义 线程 类 首先 也 是 一 个 普通 类 ,同时 还 拥有 线程 类 特有 的 
run() ,start() join() 等 一 系列 方法 。 也 就 是 说 ,可 以 在 线程 类 中 定义 其 他 方法 并 且 通 过 线 
程 对 象 调用 。 

(8) Python 标准 库 multiprocessing 用 来 创建 和 管理 进程 ,并 且 有 效 避 免 了 GIL 
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(Global Interpreter Lock) 的 问题 ,可 以 更 加 有 效 地 利用 CPU 资源 。 

(9) 可 以 通过 创建 Process 对 象 来 创建 一 个 进程 并 通过 调用 进程 对 象 的 start() 方 法 来 
启动 该 进程 的 运行 。 

(10) 可 以 使 用 Queue 对 象 .管道 .共享 内 存 `.Manager 对 象 在 进程 之 间 交 换 数据 。 


yl 
1. 叙述 创建 线程 的 方法 。 
2. 叙述 Thread 对 象 的 方法 。 
3. 叙述 线程 对 象 的 daemon 属性 的 作用 和 影响 。 
4. 解释 至 少 3 种 线程 同步 方法 。 
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第 14 章 ”数据库 编程 


毫 无 疑问 ,数据 库 技术 的 发 展 为 各 行 各 业 都 带 来 了 很 大 方便 ,数据 库 不 仅 支持 各 类 数据 
的 长 期 保存 ,更 重要 的 是 支持 各 种 跨 平 台 、 跨 地 域 的 数据 查询 .共享 以 及 修改 , 极 大 方便 了 人 
类 生活 和 工作 。 金 融 行 业 、 聊 天 系统 、 各 类 网 站 、 办 公 自 动 化 系统 、 各 种 管理 信息 系统 等 ,都 
少不了 数据 库 技术 的 支持 。 本 章 主 要 介绍 SQLite、Access、MySQL、MS SQL Server 等 几 
种 数据 库 的 Python 接口 ,并 通过 儿 个 示例 来 演示 数据 的 增 、 删 、 改 、 查 等 操作 。 为 了 节省 篇 
幅 ,本 章 并 没有 详细 介绍 数据 库 的 原理 、 概 念 以 及 SQL 语句 的 语法 ,而 是 假设 读者 已 经 了 解 
或 者 可 以 通过 查阅 相关 资料 学 习 这 部 分 内 容 。 


14.1 SQLite 应 用 


SQLite HE ALK LE Python 中 的 轻 量 级 .基于 磁盘 文件 的 数据 库 管理 系统 ,不 需要 服务 器 
进程 ,支持 使 用 SQL 语句 来 访问 数据 库 。 该 数据 库 使 用 C 语言 开发 ,支持 大 多 数 SQL91 标 
准 , 支 持原 子 的 一致 的 ,独立 的 和 持久 的 事务 ,不 支持 外 键 限制 ;通过 数据 库 级 的 独占 性 和 
共享 锁定 来 实现 独立 事务 , 当 多 个 线程 同时 访问 同一 个 数据 库 并 试图 写 入 数据 时 ,每 一 时 刻 
只 有 一 个 线程 可 以 写 人 数据。 

SQLite 支持 2TB 大 小 的 单个 数据 库 ,每 个 数据 库 完全 存储 在 单个 磁盘 文件 中 ,以 B+ 
树 数据 结构 的 形式 存储 ,一 个 数据 库 就 是 一 个 文件 ,通过 简单 复制 即 可 实现 数据 库 的 备份 。 
如 果 需 要 使 用 可 视 化 管理 工具 ,请 下 载 并 使 用 SQLiteManager、SQLite Database Browser 
或 其 他 类 似 工具 。 如 果 使 用 Python 程序 读 取 SQLite 记录 时 显示 乱码 ,可 以 尝试 修改 程序 
并 使 用 UTF-8 编码 格式 。 

访问 和 操作 SQLite 数据 时 ,需要 首先 导入 sqlite3 模块 ,然后 就 可 以 使 用 其 中 的 功能 来 
操作 数据 库 了 ,该 模块 提供 了 与 DB-API 2. 0 规范 兼容 的 SQL 接口 。 

使 用 该 模块 时 ,首先 需要 创建 一 个 与 数据 库 关联 的 Connection 对 象 ,例如 : 


import sqlite3 
conn =sqlite3.connect ('example.db') 


成 功 创建 Connection 对 象 以 后 ,再 创建 一 个 Cursor XR. If AAJA Cursor 对 象 的 
execute() 方 法 来 执行 SQL 语句 创建 数据 表 以 及 查询 、 插 入 、 修 改 或 删除 数据 库 中 的 数据 ， 
例如 : 


c=conn.cursor () 

# 创 建 表 

c.execute ("CREATE TABLE stocks (date text, trans text, symbol text, qty real, 
price real) ") 

# 插 入 一 条 记录 

c.execute ("INSERT INTO stocks VALUES ('2006- 01-05", 'BUY', 'RHAT', 100, 35.14)") 
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# 提 交 当 前 事务 ,保存 数据 
conn.commit () 
# 关 闭 数据 库 连 接 


conn.close () 


如 果 需 要 查询 表 中 内 容 , 那 么 重新 创建 Connection 对 象 和 Cursor 对 象 之 后 ,可 以 使 用 


下 面 的 代码 来 查询 ; 


>>> for row in c.execute ('SELECT * FROM stocks ORDER BY price"): 


print (row) 


14.1.1 Connection 对 象 


Connection 是 sqlite3 模块 中 最 基本 也 是 最 重要 的 一 个 类 ,其 主要 方法 如 表 14-1 所 示 。 


# 14-1 Connection 对 象 主要 方法 


方 法 说 明 
sqlite3. Connection. execute(sql[ ,parameters]) | 执行 一 条 SQL 语句 
sqlite3. Connection. executemany(sql[ ,parameters]) | 执行 多 条 SQL 语句 
sqlite3. Connection. cursor() 返回 连接 的 游标 


sqlite3. Connection. commit) 


提交 当前 事务 ,如 果 不 提 交 , 那 么 自 上 次 调用 commit() 方 法 
之 后 的 所 有 修改 都 不 会 真正 保存 到 数据 库 中 


sqlite3. Connection. rollback() 


撤销 当前 事务 ,将 数据 库 恢 复 至 上 次 调用 commit( ) 方 
法 后 的 状态 


sqlite3. Connection. close() 


关闭 数据 库 连接 


sqlite3. Connection. create_function(name, 
num_params: func) 


创建 可 在 SQL 语句 中 调用 的 函数 ,其 中 name 为 函数 
名 ,num_params 表示 该 函数 可 以 接收 的 参数 个 数 ,func 


表示 Python 可 调用 对 象 


Connection 对 象 的 其 他 几 个 函数 都 比较 容易 理解 ,下 面 的 代码 演示 了 如 何在 sqlite3 连 


接 中 创建 并 调用 自 定义 函数 : 


import sqlite3 
import hashlib 


def md5sum(t) : 
return hashlib.md5(t) .hexdigest () 


con =sqlite3.connect (":memory:") 
con.create function ("md5", 1, md5sum) 
cur =con.cursor () 

cur-execute ("select md5(?)", (b"foo",)) 


print (cur. fetchone () [0]) 
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14.1.2 Cursor 对 象 
Cursor 也 是 sqlite3 模块 中 比较 重要 的 一 个 对 象 , 该 对 象 具 有 如 下 常用 方法 。 


1. execute(sql[ ,parameters]) 
该 方法 用 于 执行 一 条 SQL 语句 ,下 面 的 代码 演示 了 该 方法 的 用 法 ,以 及 为 SQL 语句 传 
递 参 数 的 两 种 方法 ,分 别 使 用 问号 和 命名 变量 作为 占 位 符 。 


import sqlite3 


con = sqlite3.connect (":memory:") 
cur =con.cursor () 
cur.execute ("create table people (name last, age)") 
who ="Dong" 
age =38 
# 使 用 问号 作为 占 位 符 
cur.execute ("insert into people values (?, ?)", (who, age)) 
# 使 用 命名 变量 作为 占 位 符 
cur.execute("select * from people where name last= :who and age=:age", {"who": who, "age": 
age}) 


print (cur. fetchone()) 
运行 结果 如 图 14-1 所 示 。 


>> === = "RESTART ===4 
>>> 
(u'Dong', 38) 


> 


图 14-1 运行 结果 


2. executemany(sql,seq_of_parameters) 
该 方法 用 来 对 所 有 给 定 参数 执行 同一 个 SQL 语句 ,该 参数 序列 可 以 使 用 不 同 的 方式 产 
生 , 例 如 ,下 面 的 代码 使 用 迭代 来 产生 参数 序列 : 


import sqlite3 


class IterChars: 

def init__(self): 
self.count =ord('a') 

def iter (self): 
return self 

def next (self): 
if self.count >ord('z'): 

raise StopIteration 

self.count +=1 


return (chr(self.count -1),)# this is a 1- tuple 


con =sqlite3.connect (":memory:") 
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cur =con.cursor () 

cur-execute ("create table characters (c)") 

theIter =IterChars () 

cur-executemany ("insert into characters (c) values (?)", theIter) 
cur-execute ("select c from characters") 


print (cur.fetchall ()) 
下 面 的 代码 则 使 用 了 更 为 简洁 的 生成 器 来 产生 参数 : 


import sqlite3 
import string 


def char_generator () : 

for c in string.ascii_lowercase: 

yield (c,) 

con = sqlite3.connect (":memory:") 
cur =con.cursor () 
cur.execute ("create table characters (c)") 
cur.executemany ("insert into characters (c) values (?)", char_generator()) 
cur.execute ("select c from characters") 
print (cur. fetchall()) 


下 面 的 代码 则 使 用 直接 创建 的 序列 作为 SQL 语句 的 参数 : 


import sqlite3 


persons = [ 
("Hugo", "Boss"), 
("Calvin", "Klein") 
] 
con = sqlite3.connect (":memory:") 
+ 创建 表 
con.execute ("create table person (firstname, lastname)") 
# 插 入 数据 
con.executemany ("insert into person (firstname, lastname) values (?, ?)", persons) 
# 显 示 数 据 
for row in con.execute ("select firstname, lastname from person"): 
print (row) 


print ("I just deleted", con.execute ("delete from person") .rowcount, "rows") 


运行 结果 如 图 14-2 所 示 o 


|>>> = 
>>> 
(u'Hugo', u'Boss") 
(u'Calvin', u'Klein") 
I just deleted 2 rows 
>>> 


14-2 运行 结果 
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3. fetchone() ,fetchmany(size= cursor. arraysize) ,fetchall() 


这 3 个 方法 用 来 读 取 数据 。 假 设 数 据 库 通过 下 面 的 代码 创建 并 插入 数据 : 


import sqlite3 
conn =sqlite3.connect ("D:/addressBook.db") 

cur =conn.cursor () 

cur.execute ("insert into addressList (name , sex , phon , QQ, address) values 
CEN", "Ke", '13888997011' , '66735' ，' 北 京 市 ' )™) 

conn.commit () 


conn.close () 
则 下 面 的 代码 演示 了 使 用 fetchall() 读 取 数 据 的 方法 : 


import sqlite3 
conn= sqlite3.connect ('D:/addressBook.db') 
cur= conn.cursor () 
cur.execute("select * fromaddressList') 
li=cur.fetchall() 
for line in li: 
for item in line: 
if type (item) !=str: 
s= str (item) 
else: 
s=item 
print (s+ '\t', end='') 
print () 


conn.close () 


14.1.3 Row 对 象 
下 面 通过 一 个 示例 来 演示 Row 对 象 的 用 法 ,假设 数据 库 以 下 面 的 方式 创建 并 插入 数据 ， 


conn = sqlite3.connect (":memory:") 

c =conn.cursor () 

c.execute ("create table stocks (date text, trans text, symbol text, qty real, 
price real) ™) 

c.execute("""insert into stocks values ('2006- 01-05", 'BUY', "RHAT', 100, 35. 14) """) 

conn.commit () 


c.close () 
那么 ,可 以 使 用 下 面 的 方式 来 读 取 其 中 的 数据 : 


>>>conn.row_ factory =sqlite3.Row 
>>>c =conn.cursor () 

>>>c.execute ("select * from stocks") 
<sqlite3.Cursor object at 0x7f4e7dd8£a80> 


>>>r =c.fetchone () 
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>>> type (r) 

<class 'sqlite3.Row'> 

>>>tuple (r) 

("2006- 01- 05', "BUY', 'RHAT', 100.0, 35.14) 
>>> len (r) 

5 

>>>r[2] 

i 

>>>r.keys() 

['date', 'trans', 'symbol', 'qty', 'price'] 


>>> r['qty"] 

100.0 

>>> for member in r: 
print (member) 

2006- 01- 05 

BUY 

RHAT 

100.0 

35.14 


14.2 访问 其 他 类 型 数据 库 


除了 SQLite 数据 库 以 外 ,Python 还 可 以 操作 Access, MS SQL Server 和 MySQL 等 多 
种 类 型 的 数据 库 , 本 节 中 对 几 种 常见 的 接口 逐一 进行 简单 介绍 。 


14.2.1 操作 Access 数据 库 


首先 需要 安装 Python for Windows extensions, E pywin32。 然 后 可 以 参考 下 面 的 步 
又 和 方式 来 访问 Access 数据 库 。 
1. 建立 数据 库 连 接 


import win32com.client 

conn =win32com.client .Dispatch (r'ADODB.Connection") 

DSN = 'PROVIDER=Microsoft .Jet .OLEDB.4.0;DATA SOURCE=C: /MyDB.mdb; ' 
conn .Open (DSN) 


2. 打开 记录 集 


rs =win32com.client.Dispatch (r'ADODB.Recordset") 
rs_name = 'MyRecordset' # 表 名 


rs.Open('[' +rs name +']', conn, 1, 3) 
3. 操作 记录 集 


rs.AddNew () 
rs.Fields.Item(1) -Value = 'data' 
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rs.Update () 
4. 操作 数据 


conn =win32com.client .Dispatch (r'ADODB.Connection") 
DSN = 'PROVIDER=Microsoft.Jet .OLEDB.4.0;DATA SOURCE=C: /MyDB.mdb; ' 
sql_statement ="insert into [Table Name] ([Field 1], [Field 2]) values ('datal', 
"data2')" 
conn .Open (DSN) 
conn.Execute (sql_statement) 
conn.Close () 
5. 遍历 记录 
rs.MoveFirst () 
count =0 
while 1: 
if rs.EOF: 
break 
else: 
count =count +1 


rs.MoveNext () 


在 操作 Access 数据 库 时 ,如 果 一 个 记录 集 是 空 的 ,那么 将 指针 移动 到 第 一 个 记录 将 导 
致 一 个 错误 ,因为 此 时 recordcount 是 无 效 的 。 解 决 的 方法 : 打开 一 个 记录 集 之 前 , 先 将 
Cursorlocation 设置 为 3, 然 后 再 打开 记录 集 , 此 时 recordcount 是 有 效 的 。 

rs.Cursorlocation =3 


rs.Qpen('select * from [Table Name]', conn) # WAR conn 处 于 打开 状态 


rs.RecordCount 


14.2.2 操作 MS SQL Server 数据 库 


可 以 使 用 pywin32 和 pymssql 两 种 不 同 的 方式 来 访问 MS SQL Server 数据 库 。 
先 来 了 解 一 下 pywin32 模块 访问 MS SQL Server 数据 库 的 步骤 。 
1. 添加 引用 


import adodbapi 
adodbapi .adodbapi .verbose =False #adds details to the sample printout 
import adodbapi.ado_consts as adc 


2. 创建 连接 


Cfg = {'server':'192.168.29.86\\eclexpress', 'password' : 'xxxx', 'db' : 'pscitemp'} 
constr = r"Provider= SQLOLEDB.1; Initial Catalog=%s; Data Source=%s; user ID=%s; Password=% 
s; "%(Cfg['db'], Cfg['server'], 'sa', Cfg['password']) 


conn =adodbapi .connect (constr) 


3. 执行 sql 语句 
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cur =comn.cursor () 

sql ="select * from softextBook where title='{0}" and remark3!='"{1}'™. 
format (bookName, flag) 

cur-execute (sql) 

data =cur.fetchall () 


cur.close() 
4. 执行 存储 过 程 
# 假 设 proName 有 3 个 参数 ,最 后 一 个 参数 传 了 None 


ret =cur.callproc('procName', (parml, parm2,None) ) 


conn.commit () 
5. 关闭 连接 
conn.close () 


下 面 的 代码 演示 了 pymssql 模块 访问 MS SQL Server 数据 库 的 方法 。 


import pymssql 
conn =pymssql.connect (host= 'SQL01', user= 'user', password 'password', database= 'mydatabase') 
cur =conn.cursor () 
cur.execute ("create table persons (id INT, name VARCHAR (100) ) ') 
cur.executemany ("insert into persons values ($d, xinos.king)", [ (1, 'John Doe"), (2, 'Jane Doe 
") 1) 
conn.commit () 
cur.execute('select * from persons where salesrep=xinos.king', 'John Doe") 
row =cur.fetchone () 
while row: 
print ("ID=%d, Name= xinos.king" %(row[0], row[1])) 
row =cur.fetchone() 
cur.execute ("select * from persons where salesrep like 'J%'") 


conn.close () 


14.2.3 操作 MySQL 数据 库 


Python 访问 MySQL 数据 库 可 以 使 用 MySQLDb 模块 ,该 模块 的 主要 方法 有 10 个 。 
(1) commit(): 提交 事务 。 

(2) rollback() : 回 滚 事务 。 

(3) callproc(self.procname.args) : 用 来 执行 存储 过 程 ,接收 的 参数 为 存储 过 程 名 和 参 


数列 表 , 返 回 值 为 受 影响 的 行 数 。 


(4) execute(self,query,args) : 执行 单条 SQL 语句 ,接收 的 参数 为 SQL 语句 本 身 和 使 


用 的 参数 列表 ,返回 值 为 受 影响 的 行 数 。 


(5) executemany(self,query,args) : 执行 单条 SQL 语句 ,但 是 重复 执行 参数 列表 里 的 


参数 ,返回 值 为 受 影响 的 行 数 。 
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(6) nextset(self) : 移动 到 下 一 个 结果 集 。 
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(7) fetchall(self) : 接收 全 部 的 返回 结果 行 。 

(8) fetchmany(self,size=None): 接收 size 条 返回 结果 行 ,如 果 size 的 值 大 于 返回 的 
结果 行 的 数量 , 则 会 返回 cursor. arraysize 条 数据 。 

(9) fetchone(self) : 返回 一 条 结果 行 。 

(10) scroll(Cself,value,mode 王 "relative) : 移动 指针 到 某 一 行 ,如 果 mode='relative', W) 
表示 从 当前 所 在 行 移动 value A; WIE mode='absolute'", 则 表示 从 结果 集 的 第 一 行 移动 
value 条 。 

使 用 该 模块 查询 MySQL 数据 库 记 录 的 方法 如 下 : 


import MySQLdb 
try: 
conn=MySQLdb.connect (host= 'localhost',user= 'root', passwd= 'root', 
db= 'test',port= 3306) 
cur=conn.cursor () 
cur.execute('select * from user') 
cur.close () 
conn.close() 
except MySQLdb.Errorase: 
print ("Mysql Error %d: %s" $(e.args[0], e.args[1])) 


插入 数据 的 用 法 如 下 : 


import MySQLdb 
try: 
conn=MySQLdb.connect (host= 'localhost',user= 'root', passwd= 'root', port= 3306) 
cur=conn.cursor () 
cur.execute ('create database if not exists python') 
conn.select_db ("python") 
cur.execute ("create table test (id int, info varchar (20) ) ') 
value= [1, "hi rollen'] 
cur.execute (‘insert into test values (%s,%s) ', value) 
values= [] 
for i in range (20): 
values.append((i, "hi rollen'+str(i))) 
cur.executemany ("insert into test values (%s,%s) ', values) 
cur.execute (‘update test set info="I am rollen" where id=3') 
conn.commit () 
cur.close () 
conn.close() 
except MySQLdb.Errorase: 
print ("MySQL Error %d: $s" %(e.args[0], e.args[1])) 


本 章 知 识 精 要 


(1) SQLite ARK LE Python 中 的 轻 量 级 .基于 磁盘 文件 的 数据 库 管 理 系统 ,不 需要 服 
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务 器 进程 ,支持 使 用 SQL 语句 来 访问 数据 库 。 

(2) 访问 和 操作 SQLite 数据 库 时 ,需要 首先 导入 sqlite3 模块 。 

(3) 可 以 使 用 pywin32 模块 来 操作 Access 数据 库 和 MS SQL Server 数据 库 ,也 可 以 使 
用 pymssql 模块 来 操作 MS SQL Server 数据 库 。 

(4) 可 以 使 用 MySQLDb 模块 操作 MySQL 数据 库 。 


J3 wi 


1. 简单 介绍 SQLite 数据 库 。 

2. 使 用 Python 内 置 函 数 dir() 查 看 Cursor 对 象 中 的 方法 ,并 使 用 内 置 函 数 help() 查 
看 其 用 法 。 

3. 叙述 使 用 Python 操作 Access 数据 库 的 步骤 。 

4. 叙述 使 用 Python 操作 MS SQL Server 数据 库 的 步骤 。 

5. 叙述 MySQLDb 模块 提供 的 数据 库 访 问 方法 。 
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第 15 章 多 媒体 编程 


在 本 章 中 ,主要 介绍 图 形 编程 .图 像 编 程 音 乐 编程 以 及 声音 处 理 与 语音 识别 等 模块 和 
技术 。 本 章 中 用 到 的 大 部 分 模块 不 是 默认 安装 的 ,请 根据 需要 下 载 并 安装 相应 的 模块 。 


15.1 图 形 编程 


计算 机 图 形 学 主要 研究 如 何 使 用 计算 机 来 生成 具有 真实 感 的 图 形 , 涉 及 的 内 容 主 要 包 
括 三 维 建 模 、 图 形变 换 、 光 照 模型 纹理 映射 和 阴影 模型 等 内 容 , 在 机 械 制造 .虚拟 现实 ` 游 戏 
开发 .漫游 系统 设计 \ 产 品 展示 等 多 个 领域 具有 重要 的 应 用 。 随 着 3D 打印 机 的 诞生 ,只 要 
有 模型 就 能 够 快速 生成 实物 ,这 无 疑 会 大 大 扩展 计算 机 图 形 学 的 应 用 范围 ,例如 ,可 以 使 用 
计算 机 图 形 学 制作 出 各 种 可 爱 的 模型 ,然后 参照 这 些 模 型 使 用 3D 打印 机 批量 生产 各 种 食 
品 .玩偶 和 饰品 等 。 目 前 大 部 分 计算 机 图 形 学 的 书籍 都 是 基于 OpenGL 的 ,Python 也 提供 
了 PyOpenGL, 这 极 大 地 方便 了 编写 图 形 学 程序 的 Python 程序 员 。 


15.1.1 创建 图 形 编程 框架 


Python 的 跨 平 台 扩 展 模 块 PyOpenGL 封装 了 OpenGL API, 支 持 图 形 编 程 所 需要 的 所 
有 功能 。 使 用 该 模块 进行 图 形 编程 的 步骤 如 下 。 
(1) 导入 模块 。 


from OpenGL.GL import * 
from OpenGL.GLU import * 
from OpenGL.GLUT import * 
import sys 


(2) 使 用 OpenGL 创建 窗口 类 。 
class MyPyOpenGLTest: 
(3) 重 写 构造 函数 ,初始 化 OpenGL 环境 ,指定 显示 模式 以 及 用 于 绘图 的 函数 。 


def init (self, width =640, height =480, title = 'MyPyOpenGLTest .encode ("gbk") ') : 
glut Init (sys .argv) 
glutInitDisplayMode (GLUT RGBA | GLUT DOUBLE | GLUT_DEPTH) 
glut InitWindowSize (width, height) 
self.window =glutCreateWindow (title) 
glutDisplayFunc (sel£.Draw) 
glutIdleFunc (self .Draw) 
self.InitGL (width, height) 
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(4) 根据 特定 的 需要 ,进一步 完成 OpenGL 的 初始 化 。 


def InitGL(self, width, height): 


glClearColor (1.0, 1.0, 1.0, 0.0) 


glClearDepth (1.0) 
glDepthFunc (GL LESS) 
glShadeModel (GL SMOOTH) 
glEnable (GL_POINT SMOOTH) 
glEnable (GL LINE SMOOTH) 
glEnable (GL POLYGON SMOOTH) 
glMatrixMode (GL PROJECTION) 


glHint (GL POINT SMOOTH HINT,GL NICEST) 
glHint (GL LINE SMOOTH HINT,GL NICEST) 
glHint (GL POLYGON SMOOTH HINT,GL FASTEST) 


glLoadIdentity () 


gluPerspective (45.0, float (width) /float (height), 0.1, 100.0) 


glMatrixMode (GL_MODELVIEW) 


(5S) 定义 自己 的 绘图 函数 。 


def Draw (self): 


glClear (GL COLOR BUFFER BIT | GL DEPTH BUFFER BIT) 


glLoadIdentity () 
glutSwapBuf fers () 


(6) 消息 主 循环 。 


def MainLoop (self): 


glutMainLoop () 


(7) 实例 化 窗口 类 ,运行 程序 。 


if _name_ 


'_ main _': 


w =MyPyOpenGLTest () 
w.MainLoop () 


15.1.2 绘制 文字 


可 以 使 用 glutBitmapCharacter() 函 数 在 绘图 窗口 上 绘制 文字 ,该 函数 每 次 只 能 绘制 一 
个 字符 ,可 以 使 用 循环 结构 来 绘制 多 个 字符 。 改 写 前 面 图 形 编程 框架 中 的 Draw O 函数, 就 


可 以 实现 该 功能 。 


def Draw (self) : 
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glClear (GL COLOR BUFFER BIT | GL DEPTH BUFFER BIT) 


glLoadIdentity () 
glColor3f (1.0, 1.0, 1.0) 
glTranslatef (0.0, 0.0, - 1.0) 
glRasterPos2f (0.0, 0.0) 
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s = 'PYOpenGL is the binding layer between Python and OpenGL." 
for ch ins: 


glutBitmapCharacter (GLUT BITMAP 8 BY 13, ord(ch)) 


15.1.3 绘制 图 形 


在 OpenGL 中 绘制 图 形 的 代码 需要 放 在 glBegin(mode) 和 glEnd() 这 一 对 函数 的 调用 
之 间 , 其 中 mode 表示 绘图 类 型 , 取 值 范围 如 表 15-1 所 示 。 
表 15-1 mode 取 值 


取 值 说 明 取 值 说 明 
GL_POINTS 绘制 点 GL_TRIANGLE_STRIP | 绘制 三 角形 串 
GL_LINES 绘制 直线 GL_TRIANGLE_FAN | 绘制 三 角 扇形 
GL_LINE_STRIP 绘制 连续 直线 ,不 封闭 || GL_QUADS 绘制 四 边 形 
GL_LINE_LOOP 绘制 封闭 的 连续 直线 || GL_QUAD _STRIP 绘制 四 边 形 串 
GL_TRIANGLES 绘制 三 角形 GL_POLYGON 绘制 多 边 形 


例如 ,将 前 面 给 出 的 图 形 编程 框架 中 的 Draw() 函 数 改写 成 下 面 的 代码 , 则 可 以 绘制 一 
个 彩色 三 角形 和 一 条 彩色 直线 。 在 这 段 代 码 中 ,首先 设置 绘制 模式 为 多 边 形 ,然后 依次 绘制 
该 多 边 形 的 顶点 ,绘制 每 个 顶点 之 前 设置 顶点 颜色 ,最 后 修改 绘制 模式 为 直线 并 指定 直线 段 
的 端点 颜色 和 位 置 。 需 要 注意 的 是 ,使 用 glColor3f() 函 数 设置 颜色 之 后 ,直到 下 一 次 使 用 
该 函数 改变 颜色 之 前 ,绘制 的 所 有 项 点 都 使 用 这 个 颜色 。 或 者 说 ,OpenGL 采用 的 是 “状态 
机 ”工作 方式 ,一 旦 设置 了 某 种 状态 之 后 ,除非 显 式 修改 该 状态 ,否则 该 状态 将 一 直 保 持 。 

def Draw (self) : 

glClear (GL_COLOR BUFFER BIT | GL_DEPTH BUFFER BIT) 


glLoadIdentity() 
glTranslatef (- 2.0, 0.0, -8.0) 
# 绘 制 二 维 图 形 ,z 坐标 为 0 


glBegin (GL_POLYGON) # 绘 制 多 边 形 
glColor3f (1.0, 0.0, 0.0) #4 设 置顶 点 颜色 
glVertex3f (0.0, 1.0, 0.0) # 绘 制 多 边 形 顶 点 


glColor3f (0.0, 1.0, 0.0) 
glVertex3f (1.0, - 1.0, 0.0) 
glColor3f (0.0, 0.0, 1.0) 
glVertex3f (- 1.0, -1.0, 0.0) 
glEnd() 

glTranslatef (2.5, 0.0, 0.0) 
# 绘 制 三 维 图 形 

glBegin (GL_LINES) # 绘 制 直线 
glcolor3f(1.0，0.0，0.0) 
glVertex3f (1.0, 1.0, - 1.0) 
glColor3£ (0.0, 1.0, 0.0) 
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glVertex3f(-1.0, -1.0, 3.0) 
glEnd() 
glutSwapBuffers () 


上 面 的 代码 运行 结果 如 图 15-1 所 示 。 


E) MypyOpenGLTest Se 


图 15-1 绘制 图 形 


15.1.4 纹理 映射 


在 现实 中 ,人 们 主要 通过 物体 表面 丰富 的 纹理 细节 来 区 分 具有 相同 形状 的 不 同 物体 。 
在 三 维 建 模 时 也 往往 通过 纹理 映射 来 简化 建 模 的 工作 量 , 可 以 在 保证 图 形 具有 和 较 强 真 实感 
的 前 提 下 大 幅度 提高 泻 染 效率 。 

简单 地 说 ,纹理 映射 就 是 为 物体 表面 进行 贴图 以 使 其 呈现 出 特定 的 视觉 效果 。 这 需要 
首先 准备 好 纹理 ,然后 构建 物体 空间 坐标 和 纹理 坐标 之 间 的 对 应 关系 来 完成 贴图 。 可 以 使 
用 函数 来 生成 一 些 规则 的 纹理 ,例如 粗布 纹理 、 棋 盘 纹 理 等 ,也 可 以 将 拍摄 或 通过 网 络 搜索 
下 载 的 图 片 作为 纹理 映射 到 物体 表面 上 。 进 行 纹理 映射 之 前 ,首先 要 读 取 并 设置 纹理 数据 。 
在 前 面 给 出 的 图 形 编程 框架 中 增加 如 下 函数 用 来 读 取 和 设置 纹理 数据 : 


def LoadTexture (self): 
img = Image.open('sample.bmp') 
width, height =img.size 
img =img.tostring('raw', 'RGBX', 0, -1) 
glBindTexture (GL_TEXTURE_2D, glGenTextures (1) ) 
glPixelStorei (GL_UNPACK ALIGNMENT, 1) 
glTexImage2D(GL_TEXTURE_2D, 0, 4, width, height, 0, GL_RGBA, 

GL_UNSIGNED BYTE, img) 

glTexParameterf (GL_TEXTURE_2D, GL TEXTURE WRAP S, GL CLAMP) 
glTexParameterf (GL TEXTURE 2D, GL TEXTURE WRAP T, GL CLAMP) 
glTexParameterf (GL_TEXTURE_2D, GL TEXTURE WRAP _S, GL REPEAT) 
glTexParameterf (GL_TEXTURE_2D, GL TEXTURE WRAP T, GL REPEAT) 
glTexParameterf (GL TEXTURE 2D, GL TEXTURE MAG FILTER, GL_NEAREST) 
glTexParameterf (GL_TEXTURE_2D, GL TEXTURE MIN FILTER, GL NEAREST) 
glTexEnvf (GL TEXTURE ENV, GL TEXTURE ENV MODE, GL DECAL) 


然后 修改 图 形 编 程 框架 中 的 初始 化 函数 ,设置 纹理 映射 属性 ,并 进行 背面 剔除 ,修改 后 
的 代码 如 下 : 


def InitGL(self, width, height): 
self .LoadTexture () 
glEnable (GL TEXTURE 2D) 
glClearColor (0.0, 0.0, 0.0, 0.0) 
glClearDepth (1.0) 
glDepthFunc (GL_LESS) 
glShadeModel (GL_SMOOTH) 
glEnable (GL_CULL_FACE) 
glCullFace (GL_BACK) a 
glEnable (GL_LINE_SMOOTH) 
glEnable (GL_POLYGON_SMOOTH) 
glMatrixMode (GL_PROJECTION) 
glHint (GL_LINE SMOOTH HINT,GL NICEST) 
glHint (GL_POLYGON_SMOOTH_HINT,GL_ FASTEST) 
glLoadIdentity () 
gluPerspective (45.0, float (width) /float (height), 0.1, 100.0) 
glMatrixMode (GL_MODELVIEW) 


接 下 来 ,修改 图 形 编程 框架 中 的 Draw() 函 数 ,绘制 立方 体 盒子 ,并 使 用 上 面 代码 读 取 到 的 纹 
理 数 据 进行 表面 映射 : 


def Draw (self): 
glClear (GL_COLOR BUFFER BIT | GL DEPTH BUFFER BIT) 
glLoadIdentity () 
glTranslate(0.0, 0.0, - 9.0) 
glRotatef (self.x, 1.0, 0.0, 0.0) 
glRotatef (self.y, 0.0, 1.0, 0.0) 
glRotatef (self.z, 0.0, 0.0, 1.0) 


# 依 次 绘制 立方 体 的 6 个 面 并 进行 纹理 映射 
glBegin (GL_QUADS) 

glTexCoord2f (0.0, 0.0) # 设 置 纹理 坐标 
glVertex3f (- 1.0, -1.0, 1.0) # 指 定 顶 点 位 置 
glTexCoord2f (1.0, 0.0) 

glVertex3f (1.0, - 1.0, 1.0) 

glTexCoord2f (1.0, 1.0) 

glVertex3f (1.0, 1.0, 1.0) 

glTexCoord2f (0.0, 1.0) 

glVertex3f (- 1.0, 1.0, 1.0) 

另外 5 个 面 的 纹理 映射 代码 见 配套 资源 

glEnd () 

glutSwapBuffers () 
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15.1.5 处理 键盘 /鼠标 事件 


如 果 需 要 使 用 鼠标 或 键盘 来 操作 图 形 , 如 平移 、 旋 转 和 缩放 等 ,那么 首先 需要 在 初始 化 
函数 中 指定 接受 键盘 和 和 鼠标 事件 的 函数 , 即 增加 下 面 两 行 代码 : 


def init (self, width =640, height =480, title = 'MyPyOpenGLTest"): 


glutKeyboardFunc (self .KeyPress) 
glutMouseFunc (self .Mouse) 


然后 在 窗口 类 中 增加 下 面 的 函数 定义 ,用 来 接受 并 处 理 键盘 和 鼠标 事件 + 
def Mouse (self, button, mode, x, y): 
if button ==GLUT_RIGHT_BUTTON and mode ==GLUT_DOWN: 
print ('yes') 
def KeyPress (self, key, x, y): 
print (key) 


15.2 图 像 编程 


15.2.1 图 像 处 理 模块 PIL 5 pillow 功能 简介 

Python Imaging Library (PIL) 是 支持 Python 的 图 像 处 理 扩展 模块 ,支持 多 种 图 像 格 
式 , 并 提供 非常 强大 的 图 像 处 理 功 能 。PIL 模块 需要 单独 安装 后 才能 使 用 ,在 PIL 中 主要 提 
供 Image, ImageChops, ImageColor, ImageDraw, ImagePath, ImageFile, ImageEnhance 和 
PSDraw 以 及 其 他 一 些 模块 来 支持 图 像 的 处 理 。pillow 是 PIL 的 蔡 代 版 本 ,完美 支持 
Python 3 。 

使 用 该 扩展 库 时 ,首先 需要 导入 ,例如 : 


>>> from PIL import Image 


接 下 来 ,我 们 通过 几 个 示例 来 简单 演示 一 下 该 模块 的 用 法 。 
(1) 打开 图 像 文件 。 


>>> im = Image.open ('sample.jpg') 
(2) 显示 图 像 。 
>>> im. show () 


(3) 查看 图 像 信息 。 


>>>print (im. format) # 图 像 格式 
>>>print (im.size) # 图 像 大 小 


(4) 查看 图 像 直 方 图 。 
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多 媒体 编程 


>>> im.histogram() 
(5) 读 取 像 素 值 。 


>>> print (im.getpixel((100,50))) # 返 回 格式 为 (r,g,b) 的 元 组 
(124，126，123) 


(6) 设置 像素 值 ,通过 读 取 和 修改 图 像 像素 值 可 以 实现 图 像 点 运算 。 

>>> im.putpixel ( (100,50) , (128,30,120) ) # 第 二 个 参数 用 来 指定 目标 像素 的 颜色 值 

(7) 保存 图 像 文 件 。 

>>> im.save ("samplel.jpg') 

(8) 转换 图 像 格式 。 

>>> im. save (' sample .bmp') # 通 过 该 方法 可 以 进行 格式 转换 

(9) 图 像 缩 放 。 

>>> iml = im.resize((100,100)) 

(10) 旋转 图 像 ,rotate() 方 法 支持 任意 角度 的 旋转 ,而 transpose() 方 法 支持 部 分 特殊 
角度 的 旋转 ,如 90"、180"、270 "旋转 以 及 水 平 、 垂 直 翻 转 等 。 


>>> im2 = im. rotate (90) 
>>> im3 = im.transpose (Image.ROTATE_180) #180 旋转 
>>> im4 = im.transpose (Image.FLIP_LEFT_RIGHT) # 水 平 翻转 


(11) 图 像 裁剪 与 粘贴 。 


>>>box = (120, 194,220,294) 

>>> region = im.crop (box) # 定 义 裁剪 区 域 
>>> region = region.transpose (Image.ROTATE_180) 

>>> im.paste (region, box) # 粘 贴 

>>> im.show() 


例如 ,图 15-2 是 原始 lena 图 像 ,而 图 15-3 是 将 其 中 一 部 分 旋转 180" 以 后 的 结果 ,请 注 
意 左 下 角 区 域 图 像 的 变化 。 


图 15-2 原始 lena 图 像 图 15-3 ”部 分 区 域 被 旋转 180" 以 后 的 lena 图 像 
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(12) 将 彩色 图 像 分 离 为 红 、 绿 、 蓝 三 分 量子 图 ,分 离 后 每 个 图 像 大 小 与 原 图 像 一 样 ,但 
是 只 包含 一 个 颜色 分 量 。 


>>>r,g,b =im.split () 
(13) 图 像 增强 。 


>>> from PIL import ImageFilter 
>>> im5 = im. filter (ImageFilter .DETAIL) 


(14) 图 像 模 糊 。 

>>> im6 = im. filter (ImageFilter.BLUR) 

(15) 图 像 边缘 提取 。 

>>> im7 = im. filter (ImageFilter.FIND_EDGES) 
(16) 图 像 点 运算 ,整体 变 暗 或 变 亮 。 


>>> im8 = im.point (lambda i:i * 1.3) 
>>> im9 = im.point (lambda i:i * 0.7) 


也 可 使 用 图 像 增强 模块 来 实现 上 面 的 功能 ,例如 : 


>>> from PIL import ImageEnhance 
>>> enh = ImageEnhance.Brightness (im) 
>>> enh.enhance (1.3) .show() 


(17) 图 像 冷 暖色 调调 整 。 


>>>r,g,b =im.split () 

>>> r =r.point (lambda i:i * 1.3) 

>>>g =g-point (lambda i:i* 0.9) 

>>>b =b.point (lambda i:0) 

>>> im10 = Image.merge (im.mode, (r,g,b)) 
>>> im10.show() 


(18) 图 像 对 比 度 增强 。 


>>> im = Image.open ('sample.jpg') 
>>> im. show () 

>>> from PIL import ImageEnhance 
>>> enh = ImageEnhance.Contrast (im) 
>>> enh.enhance (1.3) .show () 


15.2.2 使 用 pillow 计算 椭圆 中 心 


本 节 案 例 用 来 计算 和 确定 任意 形状 椭圆 的 中 心 ,使 用 pillow 扩展 库 实现 。 
例 15-1 计算 椭圆 中 心 。 


from PIL import Image 
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import os 


def searchLeft (width, height, im): 
for w in range (width) : 
for h in range (height) : 
color= im.getpixel ((w, h)) 
if color != (255, 255, 255): 


return w 


def searchRight (width, height, im): 
for w in range(width-1, -1, - 1): 
for h in range (height) : 
color= im.getpixel ((w, h)) 
if color != (255, 255, 255): 


return w 


def searchTop (width, height, im): 
for h in range (height-1, -1, -1): 
for w in range (width) : 
color= im.getpixel ((w,h)) 
if color != (255, 255, 255): 


return h 


def searchBottom(width, height, im): 
for h in range (height) : 
for w in range (width) : 
color= im.getpixel ((w,h)) 
if color != (255, 255, 255): 


return h 


# 从 左 向 右 扫描 
# 从 下 向 上 扫描 
# 获 取 图 像 指 定位 置 的 像素 颜色 


# 遇 到 并 返回 椭圆 边界 最 左 端的 x 坐标 


# 从 右 向 左 扫描 


# 遇 到 并 返回 椭圆 边界 最 右 端的 x 坐标 


# 遇 到 并 返回 椭圆 边界 最 上 端的 y 坐标 


# 遇 到 并 返回 椭圆 边界 最 下 端的 y 坐标 


# 遍 历 指定 文件 夹 中 所 有 bmp 图 像 文 件 ,假设 图 像 为 白色 背景 ,椭圆 为 其 他 任意 颜色 
images= [f for f in os.listdir('testimages') if f.endswith('.bmp')] 


for f in images: 
f= 'testimages\'+ f 
im= Image. open (f) 


width, height=im.size 


# 获 取 图 像 大 小 


x0, xl=searchLeft (width, height, im), searchRight (width, height, im) 
y0, yl=searchBottom(width, height, im), searchTop (width, height, im) 


center= ((x0+x1)//2, (y0+yl)//2) 
im.putpixel (center, (255,0,0)) 
im.save (f[0:- 4]+ '_center.bmp') 


im.close () 


# 把 椭圆 中 心 像素 画 成 红色 
# 保 存 为 新 图 像 文件 


15.2.3 使 用 pillow 动态 生成 比例 分 配 图 


本 节 使 用 pillow 实现 另 一 个 案例 ,功能 为 : 使 用 3 种 颜色 填充 模 条 矩形 区 域 ,并 在 每 段 


315 


《Python 程序 设计 (第 2 版 )》 


中 分 别 居 中 输出 字母 A、.B、C, 要 求 A、.B、C 各 自 所 占 比 例 可 动态 调整 。 
例 15-2 动态 生成 比例 分 配 图 。 


from PIL import Image, ImageDraw, ImageFont 


def redraw(f, vl, v2): 
start= int (600 * v1) 
end= int (600 * v2) 
im= Image. open (f) 
for w in range (start) : # 绘 制 红 色 区 域 
for h in range (36, 61): 
im.putpixel ((w,h), (255, 0, 0)) 
for w in range(start, end): # 绘 制 绿色 区 域 
for h in range (36, 61): 
im.putpixel ((w,h), (0, 255, 0)) 
for w in range(end, 600): # 绘 制品 红色 区 域 
for h in range(36, 61): 
im.putpixel ((w,h), (255, 0, 255)) 
draw= ImageDraw. Draw (im) 
font= ImageFont.truetype('simsun.ttc', 18) 
draw. text ((start//2,38), 'A', (0,0,0), font=font) # 在 各 自 区 域内 居中 显示 字母 
draw.text (( (end- start) //2+ start, 38), 'B', (0,0,0), font= font) 
draw.text ( ( (600- end) //2+end,38), 'C', (0,0,0), font= font) 
im.save (f) # 保 存 图 片 


redraw (r'd:\biaotoul.png', 0.1, 0.9) 


程序 运行 结果 如 图 15-4 所 示 。 图 中 上 面 浅 蓝 色 部 分 的 百分比 是 提前 做 好 的 ,下 面 3 种 
颜色 的 矩形 区 域 和 A、B、C 是 由 程序 动态 生成 ,可 以 根据 图 片 大 小 修改 代码 中 的 数值 。 


i i 


图 15-4 ”比例 分 配 图 


15.2.4 使 用 pillow 生成 验证 码 图 片 


验证 码 在 网 络 应 用 开发 中 占有 重要 地 位 ,广泛 应 用 于 用 户 注册 、 登 录 、 留 言 . 购 物 、 网 络 
支付 等 场合 ,可 以 有 效 阻 止 恶意 用 户 频繁 地 提交 非法 数据 。 图 片 验证 码 是 比较 传统 的 验证 
码 形式 ,图 片 中 除了 经 过 平移 .旋转 、 错 切 、 缩 放 等 基本 变换 的 字母 和 数字 之 外 ,还 有 一 些 线 
条 或 其 他 干扰 因素 。 另 外 ,还 有 问答 型 验证 码 , 验 证 码 是 一 个 简单 的 问题 ,用 户 需要 输入 正 
确 的 答案 才能 进行 后 续 的 操作 。 某 些 系 统 的 验证 码 系统 更 加 复杂 ,实现 了 基于 内 容 的 图 像 
识别 功能 或 者 拼图 功能 ,题目 难度 较 大 ,在 一 定 程度 上 也 阻碍 了 用 户 的 正常 使 用 。 

例 15-3 生成 验证 码 图 片 。 


from PIL import Image, ImageDraw, ImageFont 
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import random 
import string 


# 所 有 可 能 的 字符 ,主要 是 英文 字母 和 数字 


characters= string.ascii letters+ string.digits 


# 获 取 指 定 长 度 的 字符 串 
def selectedCharacters (length) : 
"length:the number of characters to show™ 


result= 
for i in range (length) : 
result +=random.choice (characters) 


return result 


def getColor(): 
"get a random color™ 
r= random. randint (0,255) 
g= random. randint (0,255) 
b= random. randint (0,255) 
return (r,g,b) 


def main(size= (200,100), characterNumber= 6, bgcolor= (255, 255, 255) ) : 

imageTemp= Image .new('RGB', size, bgcolor) 
# 设 置 字体 和 字号 
font= ImageFont .truetype ('c:\windows\fonts\TIMESBD.TTF', 48) 
draw= ImageDraw. Draw (imageTemp) 
text=selectedCharacters (characterNumber) 
width, height=draw.textsize(text, font) 
# 绘 制 验证 码 字符 串 
offset=2 
for i in range (characterNumber) : 

offset +=width//characterNumber 

position= (offset, (size[1]- height) //2+ random. randint (- 10,10)) 

draw.text (xy=position, text=text[i], font=font, fill=getColor()) 
# 对 验证 码 图 片 进 行 简单 变换 ,这 里 采用 简单 的 点 运算 
imageFinal= Image.new('RGB', size, bgcolor) 
pixelsFinal= imageFinal.load() 
pixelsTemp= imageTemp. load () 
for y in range(0, size[1]): 

offset= random. randint (- 1,1) 

for x in range(0, size[0]): 

newx= x+ offset 
if newx>=size[0]: 
newx=size[0]-1 


elif newx< 0: 
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newx= 0 
pixelsFinal [newx, y]=pixelsTemp[x, y] 
draw= ImageDraw. Draw (imageFinal) 
# 绘 制 干扰 噪点 像素 
for i in range (int (size[0] * size[1] * 0.07)): 
draw.point ( (random. randint (0,size[0]), random.randint (0,size[1])), 
£ill=getColor ()) 
# 绘 制 干扰 线条 
for i in range (8): 
start= (0, random.randint (0, size[1]-1)) 
end= (size[0], random.randint (0, size[1]-1)) 
draw.line([start, end], fill=getColor(), width=1) 
# 绘 制 干扰 弧 线 
for i in range (8): 
start= (- 50, - 50) 
end= (size[0]+10, random.randint (0, size[1]+10)) 
draw.arc(startt+end, 0, 360, fill=getColor()) 
+ 保存 验证 码 图 片 
imageFinal .save ("result.jpg") 
imageFinal .show() 
" 


main _ ": 


main ( (200,100), 8, (255,255,255) ) 


将 上 面 的 程序 保存 并 运行 , 即 可 生成 验证 码 图 片 , 如 图 15-5 所 示 。 


if name = 


(a) 验证 码 图 片 ( …) (b) 验证 码 图 片 〈 一 ) (0) EBA (=) 
图 15-5 ”验证 码 图 片 


15.3 音乐 编程 


pygame 模块 的 mixer 模块 提供 了 支持 音乐 文件 播放 的 功能 .可 以 参考 下 面 的 网 址 下 载 
pygame 模块 并 了 解 pygame 模块 更 多 的 知识 和 用 法 。 


http://pygame.org/ftp/ 
http: //eyehere .net/2011/python- pygame- novice- professional- index/ 


http://www.pygame.org/docs/ref/ 


pygame 模块 除了 提供 mixer 模块 支持 音乐 播放 之 外 ,还 包含 了 大 量 其 他 支持 游戏 编程 
的 模块 ,如 表 15-2 所 示 。 


表 15-2 pygame 主要 模块 
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模 块 说 明 模 块 说 明 
display 屏幕 显示 time 时 间 控 制 

event 事件 处 理 cursors 控制 鼠标 指针 

image 图 像 处 理 transform 修改 和 移动 图 像 
mouse 鼠标 消息 处 理 key 读 取 键 盘 按 键 
movie 视频 文件 播放 ,需要 安装 PyMedia || font 使 用 字体 

surface 绘制 屏幕 


pygame 模块 中 用 于 音乐 播放 有 关 的 方法 主要 在 mixer 模块 中 ,如 表 15-3 所 示 。 
表 15-3 pygame. mixer 的 主要 方法 


方 法 说 OW 
pygame. mixer. init() 初始 化 ,必须 最 先 调 用 
pygame. mixer. music. load(filename) 打开 音乐 文件 
pygame. mixer. music. play(count, start) 播放 音乐 文件 
pygame. mixer. music. stop() 停止 播放 
pygame. mixer. music. pause() 暂停 播放 
pygame. mixer. music. unpause() 继续 播放 
pygame. mixer. music. get_busy() 检测 声卡 是 否 正 被 占用 


另外 , 跨 平台 音频 /视频 播放 支持 库 Phonon 也 提供 了 播放 音频 和 视频 文件 的 功能 ,或 
者 也 可 以 使 用 DirectSound 或 WMPlayer. ocx 或 其 他 控件 进行 音乐 文件 播放 。 本 节 主 要 以 
pygame 为 例 介 绍 音乐 播放 器 的 编写 。 
下 面 的 代码 使 用 pygame. mixer 模块 编写 了 一 个 简单 的 音乐 播放 器 。 程 序 运行 后 ,将 
会 自动 随机 播放 指定 文件 夹 中 所 有 mp3 音乐 文件 ,并 自动 打印 显示 当前 正在 播放 的 音乐 文 
件 名 。 当 然 ,可 以 修改 这 段 代码 以 支持 其 他 类 型 音乐 文件 的 播放 ,或 者 还 可 以 结合 第 9 章 


GUI 编程 的 知识 编写 一 个 更 加 漂亮 美观 的 音乐 播放 器 程序 。 


import os 
import pygame 
import random 


import time 


folder =r'h:\music' 


musics = [folder+ '\\'+music for music in os.listdir(folder) if music.endswith (' .mp3') ] 


total = len (musics) 


pygame.mixer. init () 


while True: 


if not pygame.mixer.music.get_busy(): 


nextMusic =random.choice (musics) 
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pygame mixer.music.load (nextMusic-encode () ) 
pygame.mixer.music.play (1) 
print ("playing… ',nextMusic) 

else: 


time.sleep(1) 


15.4 语音 识别 


使 用 Python 编写 语音 识别 程序 需要 用 到 speech 模块 ,并 且 需 要 安装 pywin32 和 
Microsoft Speech SDK 。 


speech 模块 支持 的 主要 功能 有 : 文本 合成 语音 ,将 键盘 输入 的 文本 信息 以 语音 信号 方 
式 输出 ;语音 识别 ,将 输入 的 语音 信号 识别 为 文本 ;特定 词 的 识别 ,对 输入 的 语音 信号 进行 特 


定 词 的 捕 提 ;特定 用 户 特定 词 的 识别 ,能 够 对 不 同人 、 不 同 特定 词 进行 识别 。 
speech 模块 的 主要 方法 如 表 15-4 所 示 。 
表 15-4 speech 模块 的 主要 方法 
方 法 说 明 
speech. say(phrase) 读 出 给 定 的 文本 
打印 信息 prompt 提示 用 户 使 用 语音 录入 在 phraselist 中 列 


出 的 文本 ,并 返回 用 户 录 入 的 内 容 。 该 函数 会 阻塞 当前 线 
程 直至 得 到 用 户 录入 或 者 按 Cult+ CAA RAR 


如 果 用 户 语音 录入 phraselist 中 的 任何 文本 , 则 自动 调用 回 
调 函 数 callback ,并 返回 Listener 对 象 

得 到 用 户 语 音 录 入 的 内 容 后 自动 执行 回调 函数 callback 
(spoken_text, listener) ,并 返回 Listener 对 象 


speech, input (prompt= None, phraselist = 
None) 


speech, listenfor(phraselist, callback) 


speech, listenforanything (callback) 


speech, Listener. islistening(self) 当 Listener 对 象 处 于 监听 状态 时 返回 True 
speech. Listener. stoplistening(self) 停止 监听 , 当 Listener 对 象 处 于 监听 状态 时 返回 True 
speech. islistening() 只 要 有 Listener 对 象 正 在 监听 就 返回 True 


停止 所 有 Listener 对 象 的 监听 状态 ,如 果 有 Listener 对 象 处 
于 监听 状态 则 返回 True 


speech, stoplistening() 


例如 ,下 面 的 代码 让 计算 机 读 出 用 户 输入 的 内 容 , 当 用 户 输 入 stop 时 结束 。 


>>>while True: 
words = input ("Please input some words:") 
if words.lower() =='stop': 
break 


speech. say (words) 
下 面 的 代码 让 计算 机 接受 用 户 语音 输入 ,并 重复 一 遍 用 户 语音 录入 的 内 容 , 以 文字 形式 
显示 用 户 语音 输入 的 内 容 。 


>>> contents = speech.input () 


>>> speech. say (contents) 
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>>> print (contents) 


本 章 小 结 


(1) Python 的 跨 平台 扩展 模块 PyOpenGL 封装 了 OpenGL API, 支 持 图 形 编 程 所 需要 
的 所 有 功能 。 

(2) OpenGL 采用 的 是 “状态 机 ”工作 方式 ,一 旦 设置 了 某 种 状态 之 后 ,除非 显 式 修改 该 
状态 ,否则 该 状态 将 一 直 保持 ,例如 图 形 顶 点 的 颜色 、 法 向 量 和 纹理 坐标 等 。 

(3) PIL 是 支持 Python 的 图 像 处 理 模块 ,提供 了 强大 的 图 像 处 理 功能 。 

(4) 可 以 使 用 pygame. mixer,Phonon, DirectSound 或 WMPlayer. ocx 等 多 种 方式 进行 
音乐 文件 播放 。 

(5) 使 用 Python 编写 语音 识别 程序 需要 用 到 speech 模块 ,并 且 需 要 安装 pywin32 模 
块 和 Microsoft Speech SDK 。 


J 题 


1. 编程 程序 ,在 窗口 上 绘制 一 个 三 角形 ,设置 3 个 顶点 为 不 同 的 颜色 ,并 对 内 部 进行 光 
滑 着 色 。 

2. 编写 程序 , 读 取 两 幅 大 小 一 样 的 图 片 ,然后 将 两 幅 图 像 的 内 容 释 加 到 一 幅 图 像 ,结果 
图 像 中 每 个 像素 值 为 原来 两 幅 图 像 对 应 位 置 像素 值 的 平均 值 。 

3. 编写 程序 , 读 取 一 幅 图 像 的 内 容 , 将 其 按 象限 分 为 4 等 份 ,然后 1、3 象限 内 容 交 换 ， 
2.4 象限 内 容 交换 ,生成 一 幅 新 图 像 。 

4. 结合 GUI 编程 知识 ,编写 一 个 程序 ,创建 一 个 窗口 并 在 上 面 放置 两 个 按钮 ,分 别 为 
“开始 播放 ”和 “暂停 播放 ”, 将 本 章 15. 3 节 中 的 音乐 播放 程序 进行 封装 。 

5. 运行 本 章 15.4 中 的 代码 并 查看 运行 结果 。 
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对 于 大 多 数 程序 员 而 言 ,或许 并 不 关心 关于 硬件 与 操作 系统 底层 或 者 软件 运行 机 制 的 
细节 ,只 需要 也 只 希望 把 更 多 的 精力 放 在 高 层 的 业务 逻辑 实现 上 面 。 但 是 毫 无 疑问 ,如 果 您 
对 底层 细节 了 解 或 熟悉 的 话 ,就 能 够 对 自己 开发 的 软件 进行 更 好 的 把 握 和 控制 。 对 硬件 和 
系统 底层 的 深刻 理解 有 利于 写 出 更 好 的 应 用 程序 ,对 于 程序 员 的 职业 发 展 也 是 非常 有 帮助 
的 。 而 在 某 些 领 域 ,逆向 工程 是 解决 问题 非常 重要 的 方式 ,甚至 可 能 是 唯一 的 方式 ,例如 软 
件 安全 测试 ,加密 解密 、 软 件 汉化 .漏洞 挖掘 .计算 机 取证 、 恶 意 软件 分 析 和 版 权 保护 等 。 在 
这 些 领 域 中 ,一般 很 难 获得 软件 源 代 码 , 只 能 对 二 进 制 可 执行 文件 进行 分 析 ,而 可 执行 文件 
由 于 编译 器 的 优化 一 般 变 得 非常 难以 理解 ,甚至 很 多 恶意 软件 根本 没有 可 独立 运行 的 文件 ， 
而 是 将 代码 注入 到 其 他 正常 进程 中 。 另 外 ,最 近 几 年 提出 的 ROP、JOP 攻击 甚至 没有 注入 
任何 代码 ,仅仅 通过 精心 选择 和 重新 组 合 进程 中 已 有 的 指令 序列 就 可 以 实现 自己 的 恶意 功 
能 。 所 有 这 些 都 给 安全 分 析 人 员 造 成 很 大 困难 和 挑战 ,这 要 求 分析 人 员 对 逆向 工程 有 着 更 
全 面 而 准确 的 理解 和 把 握 , 并 且 能 够 熟练 运用 各 种 成 熟 的 工具 ,必要 的 时 候 甚 至 需要 自己 编 
写 程序 来 完成 分 析 任 务 。 从 另 一 个 角度 来 讲 , 从 源 代 码 级 别 对 软件 进行 分 析 ,无 法 获知 编译 
器 对 最 终 可 执行 文件 造成 的 影响 ,或 者 说 ,很 难保 证 编译 器 能 够 忠实 地 、 毫 无 错误 地 工作 。 
不 幸 的 是 ,编译 器 本 身 也 是 软件 的 一 种 ,同样 也 有 可 能 存在 漏洞 。 从 底层 对 最 终 可 执行 文件 
进行 分 析 , 可 以 综合 考虑 各 方面 的 因素 (包括 加 载 过 程 、. 进 程 管理 和 内 存 管 理 等) ,虽然 难度 
相对 较 大 ,但 是 可 以 得 到 更 加 全 面 和 准确 的 信息 ,甚至 可 以 控制 和 修改 软件 的 运行 过 程 。 

在 本 章 中 ,重点 介绍 Windows 平台 上 PE 文件 的 分 析 。PE 的 全 称 是 Portable 
Executable, 指 可 移植 的 可 执行 文件 ,目前 的 最 新 版 本 是 2013 年 2 月 6 日 发 布 的 8.3 版 。 
PE 文件 包括 exe 文件 .com 文件 、dll 文件 ,ocx 文件 .sys 文件 、scr 文件 等 Windows 平台 上 
所 有 可 执行 文件 类 型 ,可 以 说 PE 文件 是 Windows 操作 系统 和 Windows 平台 上 所 有 软件 
和 程序 能 够 正常 运行 的 重要 基础 。 

需要 说 明 的 是 ,应 尽量 避免 直接 在 本 地 物理 主机 上 分 析 恶 意 软件 ,以 免 被 恶意 软件 感染 
而 造成 不 必要 的 损失 。 为 了 保证 物理 主机 安全 ,同时 也 为 了 能 够 在 分 析 环 境 被 恶意 软件 感 
染 之 后 快速 恢复 系统 ,建议 您 使 用 VirtualBox, VMware, QEMU 等 虚拟 机 系统 或 沙 箱 系统 
进行 保护 。 如 果 您 没有 条 件 使 用 虚拟 机 或 沙 箱 系 统 , 也 请 使 用 Deep Freeze, Truman, FPG 
或 其 他 类 似 软件 来 保护 物理 主机 以 防止 系统 被 感染 。 


16.1 主流 项 目 与 插件 简介 


在 软件 安全 和 逆向 工程 领域 ,有 大 量 的 成 熟 工具 以 及 针对 不 同 工 具 和 目的 开发 的 各 种 
插件 ,例如 IDA Pro, OllyDbg, WinDbg, W32DASM, PEid, ssdeep, DiStorm, DisView, 
LordPE, PIN, Universal PE Unpacker 和 Sample Chart Builder 等 ,可 以 说 是 数不胜数 。 本 
书 中 主要 介绍 使 用 Python 开发 或 可 以 使 用 Python 进行 二 次 开发 的 工具 和 插件 :以 及 如 何 
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使 用 Python 开发 PE 文件 逆向 分 析 工 具 。 
16.1.1 主流 项 目 


目前 已 有 大 量 使 用 Python 作为 主要 语言 开发 的 软件 逆向 分 析 工 具 , 下 面 列 出 了 知名 
度 较 高 的 几 款 。 

(1) PyEmu: 可 编写 脚本 的 模拟 器 ,对 恶意 软件 分 析 非 常 有 用 。 

(2) Immunity Debugger: 著名 的 调试 器 ,是 在 OllyDbg 的 源 代码 基础 上 建立 起 来 的 ， 
外 观 与 OllyDbg 非常 相似 ,并 且 两 者 共享 很 多 的 底层 功能 和 控制 。Immunity Debugger 带 
有 内 置 的 Python API, 是 可 编写 脚本 
的 GUI 和 命令 行 软件 调试 器 ,支持 exploit 二 进 制 可 执行 文件 逆向 工程 等 各 种 应 用 。 

(3) Paimei: 完全 使 用 Python 编写 pre 常 -成熟 的 道 向 工程 框架 ,包括 PyDBG、PIDA 
和 pGRAPH 等 多 个 可 扩展 模块 ,可 以 执行 大 量 静 态 分 析 和 动态 分 析 , 例 如 模糊 测试 .代码 
覆盖 率 跟踪 和 数据 流 跟踪 等 。 

(4) ropper: 比较 成 熟 的 ROP Gadgets 查找 与 可 执行 文件 分 析 工 具 , 其 反 汇编 部 分 使 
用 了 成 熟 的 Capstone 框架 。 

(5) WinAppDbg: 纯 Python 调试 器 ,没有 本 机 代码 ,使 用 ctypes 封装 了 许多 与 调试 器 
有 关 的 Win32 API 调用 ,并 且 为 操作 线程 、 库 和 进程 提供 了 强 有 力 的 抽象 。 利 用 该 工具 可 
以 将 自己 编写 的 脚本 附加 为 调试 器 .跟踪 执行 .拦截 API 调用 ,以 及 在 待 调试 进程 中 处 理事 
件 , 并 且 可 以 设置 各 种 断 点 。 

(6) YARA: 恶意 软件 识别 和 分 类 引擎 ,也 可 以 利用 YARA 创建 规则 以 检测 字符 串 、 和 人 
EE 既 可 以 使 用 命令 行 模式 下 的 YARA 工具 扫描 文件 ,也 
可 以 利用 YARA 提供 的 API 函数 将 YARA 扫描 引擎 集成 到 C 或 Python 语言 编写 的 工 
具 中 。 


16.1.2 常用 插件 


经 过 多 年 努力 ,不 同 的 研究 人 员 分 别 推出 了 用 于 不 同 软件 分 析 需 要 的 IDA, OllyDbg 以 
及 Immunity Debugger 插件 ,大 大 简化 了 分 析 人 员 的 工作 。 除 了 以 下 几 种 常用 插件 ,还 可 以 
通过 SDK 编写 自己 的 插件 ,或 者 通过 一 定 技术 将 OllyDbg 插件 转换 为 Immunity Debugger 
插件 ,大 大 提高 了 插件 的 应 用 范围 和 生命 力 。 

(1) IDAPython 插件 : IDAPython 是 运行 于 交互 式 反 汇编 器 IDA 的 插件 ,用 于 实现 
IDA 的 Python 编程 接口 。IDA 在 逆向 工程 领域 具有 广泛 的 应 用 ,尤其 是 二 进 制 文件 静态 
分 析 ,其 强大 的 反 汇 编 功能 一 直 在 业内 处 于 领先 水 平 。IDAPython 插件 使 得 Python 脚本 
程序 能 够 在 IDA 中 运行 并 实现 自 定义 的 软件 分 析 功 能 ,通过 该 插件 运行 的 Python 脚本 程 
序 可 以 访问 整个 IDA 数据 库 , 并 且 可 以 方便 地 调用 所 有 IDC 函数 和 使 用 所 有 已 安装 的 
Python 模块 中 的 功能 。 目 前 ,IDAPython 还 不 支持 Python 3, 较 高 版 本 的 IDA 中 集成 了 
IDAPython 插件 ,如果 需 要 安装 或 升级 ,需要 登录 其 官方 网 站 下 载 安装 适合 您 当前 已 安装 
Python 和 IDA 版 本 的 IDAPython 插件 。 

(2) Hex-Rays Decompiler: IDA 插件 ,非常 成 熟 的 反 编 译 插件 。 

(3) PatchDiff2: IDA 插件 ,主要 用 于 补丁 对 比 。 
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(4) BinDiff: IDA 插件 ,主要 用 于 二 进 制 文件 差异 比较 。 

(5) hidedebug: Immunity Debugger 插件 ,可 以 隐藏 调试 器 的 存在 ,用 来 对 抗 某 些 通用 
的 反 调试 技术 。 

(6) IDAStealth: IDA 插件 ,可 隐藏 IDA Debugger 的 存在 ,用 来 对 抗 某 些 通用 的 反 调 
试 技术 。 


16.2 IDAPython 与 Immunity Debugger 编程 


16.2.1 IDAPython 编程 


安装 IDAPython 插件 时 ,一 定 要 正确 选择 适合 已 安装 Python 和 IDA 的 版 本 ,和 否则 可 
能 无 法 在 IDA 中 加 载 IDAPython 和 运行 Python 程序 。 安 装 成 功 以 后 ,启动 IDA 会 看 到 软 
件 界面 最 下 端 有 个 Python 标志 ,在 后 面 的 文本 框 中 可 以 直接 输入 并 运行 Python 代码 ,如 
图 16-1 所 示 。 另 外 ,使 用 IDLE 或 其 他 Python 开发 环境 或 者 记事 本 等 文本 编辑 器 编写 
Python 程序 后 ,在 IDA 主 界面 中 单 击 菜单 File, 然 后 选择 Script file, 在 弹出 的 “脚本 文件 选 
择 ” 对 话 框 中 ,可 以 看 到 文件 类 型 为 . idc 和 . py 两 种 ,如 图 16-2 所 示 。 也 就 是 说 ,现在 可 以 
在 IDA 中 运行 Python 程序 了 ,最 后 选择 并 运行 您 自己 编写 的 Python 程序 来 实现 自 定义 的 
二 进 制 文件 分 析 任 务 。 
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图 16-1 IDAPython 插件 安装 成 功 的 IDA 软件 界面 


接 下 来 ,主要 通过 几 个 示例 来 演示 如 何 使 用 Python 编程 并 在 IDA 中 运行 来 实现 PE 文 
件 分 析 。 详 细 的 IDC 库 函 数 可 以 查阅 官方 网 址 : 


https://www.hex- rays.com/products/ida/support/idadoc/162.shtml 
https://www.hex- rays.com/products/ida/support/idapython docs/index.html 
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图 16-2 “脚本 文件 选择 ”对 话 框 


(1) 查看 PE 文件 中 所 有 段 的 名 字 、 起 始 地 址 以 及 结束 地 址 。 


for seg in Segments () : 
print SegName (seg), '(',hex (SegStart (seg)),',',hex (SegEnd (seg) ), ') ' 


(2) 查看 PE 文件 中 所 有 段 的 名 字 与 长 度 。 


segments =dict () 
for seg_ea in Segments () : 

segments [SegName (seg_ea)] =SegEnd(seg_ea)- seg ea 
for seg name, seg data in segments.items(): 


print seg name,seg data 
(3) 查看 PE 文件 中 所 有 函数 信息 。 


for segment in Segments () : 
for function_ea in Functions (SegStart (segment) , SegEnd (segment) ) : 


print hex (function_ea) ,GetFunctionName (function_ea) 
(4) 查找 PE 文件 中 指定 函数 调用 ,并 将 该 行 设 置 为 红色 进行 高 亮 显 示 。 


from idaapi import * 
danger functions = ['strepy', 'sprintf', 'strncpy', 'memcpy'] 
for func in danger_functions: 
addr =LocByName (func) 
if addr !=BADADDR: 
cross_refs =CodeRefsTo (addr, 0) 


print 'Cross References to $s'tfunc 


for ref in cross_refs: 
print 'S08x'Sref 
SetColor (ref,CIC_ITEM, 0x0000££) 
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(5) 遍历 函数 chunk, 


function chunks = [] 
for ea in Functions () : 
func iter =idaapi.func tail iterator t(idaapi.get_func (ea) ) 
status =func iter.main() 
while status: 
chunk = func_iter.chunk() 
function chunks .append ( (chunk. startEA, chunk.endEA) ) 
status =func_iter.next () 
for chunk in function_chunks: 
print (hex (chunk[0]),hex(chunk[1])), "belongs to function:"',GetFunctionName (chunk [0]) 


(6) 统计 函数 入 度 与 出 度 。 


from sets import Set 

ea =ScreenER() 

callers =dict() 

callees =dict() 

for function_ea in Functions (SegStart (ea) ,SegEnd (ea) ) : # 遍历 当前 段 中 的 函数 


£_name =GetFunctionName (function ea) # 获 取 函 数 名 字 
Callers[f name] =Set (map (GetFunctionName, CodeRefsTo (function_ea,0))) 
# 调 用 该 函数 的 所 有 函数 
for ref ea in CodeRefsTo (function ea,0): # 遍 历 调 用 该 函数 的 所 有 函数 


caller_name =GetFunctionName (ref ea); 
callees[caller_name] =callees.get (caller_name, Set ()) 
callees[caller_name] .add(f_name) 
functions = Set (callees.keys ()+callers.keys ()) 
for f in functions: 
print '%- 4d::%s::%4d'% (len(callers.get (f, [])), f, len (callees.get (f, []))) 


(7) 统计 PE 文件 中 的 指令 频 度 。 F 
_SEH_prolog4 
FH mnilon4 a 
mnemonics =dict () al , 
Line 402 of 402 
ea = ScreenEA () 国 output window 
for head in Heads (SegStart (ea), SegEnd (ea) ) : inc 254 
ea ` b 304 
if isCode (GetFlags (head) ) : je 
= 477 
mnem = GetMnem (head) Jap 662 
mnemonics [mnem] =mnemonics.get (mnem, 0)+1 jz 820 
test 899 
mnem list =map (lambda x: (x[1],x[0]), mnemonics.items ()) lea tt 
= jnz 
mem list.sort () xor 1537 
= cmp 1633 
for cnt, mnem in mem list: call 1894 
retn 1893 
print mnem, cnt pop 2269 
add 2812 
a nT] = h 6410 
针对 某 动 态 链接 库 文件 ,上 面 的 代码 运行 结果 如 图 16-3 [hov 11538 


所 示 。 as) 
z idle Down Disk: 78GB 
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(8) 查 找 潜在 的 ROP Gadgets. 


ROP(Return-Oriented Programming) 是 近 几 年 来 流行 图 16-3 指令 频 度 统计 结果 


BATEIRE 


的 一 种 攻击 方式 。 在 早 些 年 ,黑客 通过 各 种 溢出 漏洞 和 保护 机 制 的 缺陷 来 实现 任意 代码 注 
入 和 执行 ,后 来 由 于 数据 执行 保护 (Data Execution Prevention, DEP) 和 地 址 空间 布局 随机 
化 (Address Space Layout Randomization ,ASLR) 等 保护 技术 的 部 署 ,实现 代码 注入 攻击 的 
难度 越 来 越 大 ,于 是 聪明 的 黑客 又 发 明了 ROP 攻击 及 其 各 种 变种 ,其 主要 思想 是 通过 精确 
控制 进程 的 执行 流程 ,重新 组 合 和 复 用 可 执行 文件 中 已 经 存在 的 代码 ,实现 恶意 目的 并 绕 过 
特定 的 防护 技术 和 系统 。 目 前 针对 ROP 攻击 较为 有 效 的 防护 技术 有 不 定期 ASLR 与 控制 
流 完整 性 约束 (Control Flow Integrity,CFI) 技 术 。 粗 粒度 ASLR 已 经 被 确认 不 安全 ,而 细 
粒度 ASLR 会 导致 代码 膨胀 从 而 增加 了 潜在 的 Gadgets, 并 且 很 可 能 会 使 得 库 函 数 无 法 共 
享 ,从 而 严重 影响 了 细 粒 度 ASLR 的 实用 性 。 

ROP 攻击 首先 要 利用 特定 漏洞 来 实现 栈 上 内 容 的 覆盖 ,通过 覆盖 栈 上 的 函数 返回 地 址 
来 实现 控制 流 的 修改 ,重新 组 合 已 有 的 代码 并 构造 Gadgets 链 来 实现 恶意 目的 。ROP 
Gadgets 是 指 较 短 的 汇编 指令 序列 ,一般 以 ret 指令 或 其 他 间接 跳 转 指 令 ( 例 如 jmp eax 或 
call eax 等 ) 结 束 , 每 个 Gadget 仅仅 实现 功能 非常 有 限 的 运算 ,但 大 量 的 Gadgets 链接 起 来 
却 可 以 实现 任意 功能 。ROP 已 被 证 明 是 图 灵 完 备 的 。 

下 面 的 代码 演示 了 在 PE 可 执行 文件 中 搜索 ROP Gadgets 的 基本 原理 。 这 只 是 个 基本 的 
演示 ,并 没有 考虑 更 加 复杂 的 情况 。 例 如 ,如 果 控 制 流 能 够 跳 转 到 指令 中 间 开 始 执行 ,就 会 打 
乱 原 有 的 指令 序列 而 产生 新 的 指令 ,从 而 产生 原本 不 存在 的 Gadget, 这 种 情况 这 里 没有 考虑 。 
您 可 以 根据 需要 对 下 面 的 代码 进行 修改 ,或 者 阅读 ropper 工具 的 源 代码 以 了 解 更 多 知识 。 


import time 
import re 
instructions = [] 
controlInstructions = ('call', 'ret', 'retn','jmp','jz','je','jnz','jne', 
'js','jns', 'jo', 'jno', "jp", 'jpe', 'jnp', "jpo', "jc", 
'jb','jnae','jbe','jna','jnc','jnb','jae','jnbe', 
'ja', 'jl', 'jnge', 'jnl', "jge',"jle', 'jng', 'jnle', 
jg 'joxz', "jecxz') 
def ReadInstructions(): 
for seg_ea in Segments () : 
for head in Heads (seg_ea, SegEnd (seg ea)): 
if isCode (GetFlags (head) ) : 
# here using GetMnem (head) can get only mnemonic 
instruction =GetDisasm (head) 


instructions.append ( (hex (head) , instruction) ) 


#print all the direct or indirect control instructions 
print "The number of all instructions found is:', len (instructions) 
print ‘And the direct or indirect control instructions are:' 


allcontrolInstructionsCount =0 #the number of control instructions 


#get all the mnemonics from instructions 


mnemonics = [t[1] .split() [0] for t in instructions] 
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for ins in controlInstructions: 
if ins in memonics: 
print ins,mnemonics.count (ins) 
allControlInstructionsCount= + mnemonics .count (ins) 


print "The number of all control instructions is:',allControlInstructionsCount 


# check if given instruction is a indirect control diversion instruction 
def Check (instruction) : 
if instruction.startswith('ret') or instruction.startswith('retn'): 
return True 
else: 
for instr in controlInstructions: 
if instr in ('ret', 'retn'): 
continue 
if instruction.startswith (instr +' e'):#like call edi 
return True 


return False 


# output the potential gadgets 
def Output (start, end): 

print '='* 30 

for i in range(start, end+1): 


print instructions [i] 


# find potential gadgets 
def FindGadgets (): 
total =len(instructions) 
gadgetNumber =0 
index =total -1 
while index >=0: 
instruction = instructions [index] 
if Check (instruction[1]): 
gadgetNumber +=1 
for i in range(1, 20): 
if Check (instructions [index -i][1]): 
Output (index -i +1, index) 
index = index -i 
break 
else: 
Output (index - 19, index) 
index -=19 
else: 


index -=1 
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print '='* 30 
print "Total number of gadgets:', gadgetNumber 


start =time.time() 
ReadInstructions () 
FindGadgets () 


print time.time() - start 


16.2.2 Immunity Debugger 编程 


款 使 用 Python 开发 的 ,非常 成 熟 的 调试 器 软件 ,支持 软件 调 
软件 分 析 以 及 可 执行 文件 


Immunity Debugger 是 


试 的 几乎 所 有 功能 ,可 以 用 于 实现 漏洞 利用 编写 .模糊 测试 、 恶 


的 逆向 工程 分 析 , 并 且 支 持 PyCommand 接口 以 支持 Python 编程 进行 二 次 开发 ,其 启动 界 
面 如 图 16-4 所 示 。 

E 

J Ax OU MAH l emtwhcPkbz r.. s ? MEZEI 


Rddress [Hex dury 
ndloop 01007303 


图 16-4 Immunity Debugger 启动 界面 


在 Immunity Debugger 界面 中 的 工具 栏 上 单 击 左边 第 二 个 带 有 符号 二 二 二 的 工具 按 
钮 ,打开 Immunity Debugger Python Shell 窗口 ,在 该 窗口 中 可 以 直接 执行 Python 语句 ,并 
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通过 对 象 imm 来 访问 Immlib 库 的 所 有 成 员 , 如 图 16-5 所 示 。 或 者 ,可 以 通过 在 Immunity 
Debugger 主 界面 下 面 的 命令 框 中 输入 *!1” 符 号 来 执行 编写 好 的 Python 程序 完成 分 析 任 务 ， 
如 图 16-6 所 示 。 


JSS Axo UMAGA Temtwhcpkbzr 
ne | 


Immunity Debugger Python Shell v0.1 *** 
Immlib instantiated as 'imm' PyObject 
READY. 


SE >> >imm.openProcess["c:\\windows\\notepad.exe") 
0 


>>>regs = imm.getRegs) 

>>>print regs 

fEIP': 16806813L, "ESP*: 5242281, ‘EDI: 68813901, 'EAX": 01 
>>>regs[EIP'] 

16806813L 


图 16-5 ”在 Immunity Debugger 中 执行 Python 语句 


‘search RET 
Search completed? 


图 16-6 在 Immunity Debugger 中 执行 Python 程序 


编写 自己 的 插件 时 ,可 以 使 用 IDLE 或 记事 本 等 任意 文本 编辑 器 编写 Python 源 程序 ， 
然后 将 程序 文件 存放 至 Immunity Debugger 安装 目录 下 的 PyCommands 目录 中 ,最 后 通过 
在 Immunity Debugger 主 界面 下 方 命令 框 中 输入 “!1” 后 加 上 程序 文件 名 称 即 可 执行 ,如 
图 16-6 所 示 。 下 面 再 通过 几 个 示例 来 演示 如 何 利用 Python 编程 实现 PE 文件 分 析 , 您 也 
可 以 参考 Immunity Debugger 安装 目录 下 的 PyCommands 目录 中 的 文件 来 了 解 更 多 分 析 
技巧 ,或 者 根据 自己 的 软件 分 析 需 求 来 编写 相应 的 插件 。 
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1. 寻找 可 执行 文件 中 的 循环 


from immlib import * 
from immutils import * 


import getopt 


DESC=""" Find natural loops given a function start address 


def usage (imm) : 


imm. log ("!findloop -a < address>") 
imm.log("-a (function start address) ") 


imm.log ("-h This help") 


def main (args) : 
imm = Debugger () 
try: 


opts, argo =getopt.getopt (args, " 
except: 
return usage (imm) 


for o,a in opts: 


ifo=="- 
loops = imm. findLoops (int (a, 16) ) 
for loop in loops: 
imm. log ("LOOP! from:0x%08x, to:0x%08x"% (loop[0], loop[1]) , loop[0]) 
func = imm.getFunction (int (a, 16) ) 
bbs = func.getBasicBlocks () 
# 寻 找 第 一 个 和 最 后 一 个 节点 
first =0xffffffff 
last =0 
for node in loop[2]: 
if node < first: first =node 
if node > last: last =node 
# 标记 循环 节点 ,但 如 果 存 在 任何 形式 的 注释 就 不 做 任何 改变 
for node in loop[2]: 
imnm.1og(" Loop node:0x%08x"%node, node) 
for bb in bbs: 
if bb.getStart () ==node: 
instrs =bb.get Instructions (imm) 


for op in instrs: 


if not imm.getComment (op.getAddress ()) and op.getAddress 


() !=node: 
if node = = last and op. getAddress () 
[-1] .getAddress () : 
# 最 后 一 个 节点 的 最 后 一 个 指令 
imm.setComment (op.getAddress (), "/") 


else: 


== instrs 
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imm. setComment (op.getAddress (), "|") 
if not imm.getComment (node) : 
if node ==first: 
imm.setComment (node, "\ Loop 0x%08X Node" (loop[0])) 


else: 


imm.setComment (node, "| Loop 0x%08X Node"s (loop[0])) 
return "Dom 


if o =="-h": 


return usage (imm) 


2. 寻找 可 执行 文件 中 的 打包 器 


import immlib 
import getopt 
import struct 


DESC ="""Find a Packer/Cryptor on a Module (Note: It might take some times due to the amount of 


signature on our db)""" 


def usage (imm) : 
imm.1log("!findpacker [-f] -m filename/module Get the RPC information of a loaded dll or 
for all loaded DLL's", focus=1) 
imm.1log(" -m filename/module File or Module to search for") 
imm.log(" -f When set, it look in the file instead of the loaded module") 
imm.log(" ex: !findpacker -m notepad") 
imm.log("NOTE: It might take same times due to the amount of signature on our db") 


def main (args) : 
imm = immlib. Debugger () 
if not args: 
usage (imm) 
return "No args" 
try: 
opts, argo =getopt.getopt (args, "m:f") 
except getopt.GetoptError: 
usage (imm) 


return "Bad heap argument $s" %args [0] 


module =None 
OnMemory =1 


for ova in opts: 


件 分 析 


if not module: 
usage (imm) 


return "No module provided, see the Log Window for details of usage" 


try: 
ret =imm.findPacker ( module, OnMemory =OnMemory) 
except Exception, msg: 


return "Error: $s" $msg 


if not ret: 


return "No Packer found" 


for (addr, name) in ret: 
imm.log("Packer found!: $s at 0x%08x" %(name, addr), address =addr) 
return "Packers found on $s: $d" % (module, len(ret)) 


3. 寻找 可 执行 文件 中 的 指令 


import immlib 


DESC ="Search code in memory" 
def usage (imm) : 
imm. log ("!searchcode Search code in memory") 


imm. log ("!searchcode < asm code>") 


def main (args) : 
imm = immlib. Debugger () 
look =" "join (args) 
ret =imm.search( imm.assemble( look ) ) 
for a in ret: 
module = imm. findModule (a) 
if not module: 
module = "none" 
else: 
module =module [0] 
#Grab the memory access type for this address 
page = imm.getMemoryPageByAddress (a ) 
access =page.getAccess ( human =True ) 
imm.log ("Found $s at 0x%08x [%s] Access: (%s)" %(look, a, module, access), address = 
a) 
if ret: 
return "Found $d address (Check the Log Window for details)" slen (ret) 
else: 


return "Sorry, no code found" 
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16.3 Windows 平台 软件 调试 原理 


不 论 使 用 什么 语言 开发 软件 调试 器 ,其 基本 原理 都 是 一 致 的 ,都 是 调用 操作 系统 自身 提 
供 的 调试 接口 ,设置 断 点 ,并 对 被 调试 软件 的 执行 过 程 以 及 有 关 事 件 进行 跟踪 和 处 理 。 在 本 
节 中 ,主要 介绍 Windows 平台 上 的 调试 接口 ,调试 事件 和 断 点 等 基本 概念 与 调试 原理 。 


16.3.1 Windows 调试 接口 


在 Win32 中 自 带 了 大 量 支 持 不 同类 型 应 用 开发 的 API 函数 ,其 中 一 部 分 被 称 为 Win32 调 
试 API(Win32 Debug APD ,提供 了 编写 软件 调试 器 所 需要 的 大 部 分 功能 。 利 用 这 些 API 可 以 
加 载 一 个 程序 或 将 调试 器 捆绑 到 一 个 正在 运行 的 进程 上 以 供 调试 ;可 以 获得 被 调试 进程 的 深 
层 信息 ,例如 进程 人 D、 入 口 地 址 和 映像 基 址 等 ;甚至 可 以 对 被 调试 的 程序 进行 任意 的 修改 , 包 
括 进程 的 内 存 和 线程 的 运行 环境 等 。 表 16-1 列 出 了 常用 的 Windows 调试 API。 


表 16-1 常用 的 Windows 调试 API 


API 函数 功能 说 明 

ContinueDebugEvent() 恢复 先前 由 于 调试 事件 而 挂 起 的 线程 

DebugActiveProcess() 将 调试 器 捆绑 到 一 个 正在 运行 的 进程 上 

DebugActiveProcessStop() | 将 调试 器 从 一 个 正在 运行 的 进程 上 印 载 
在 当前 进程 中 产生 一 个 断 点 异常 ,如 果 当 前 进程 不 是 处 在 被 调试 状态 , 那 

DebugBreak() 么 这 个 异常 将 被 系统 例 程 接管 ,多 数 情况 下 会 导致 当前 进程 被 终止 。 与 
在 程序 中 直接 插入 INT 3 的 效果 一 样 

DebugBreakProcess() 在 指定 进程 中 产生 一 个 断 点 异常 

Riba 使 调用 进程 强制 退出 ,将 控制 权 转 移 至 调试 器 ,在 退出 前 会 先 调 用 一 个 
INT 3 断 点 

FlushInstructionCache() 刷新 指令 高 速 缓存 

GetThreadContext() 获取 指定 线程 的 执行 环境 

GetThreadSelectorEntry() | 返回 指定 选择 器 和 线程 的 描述 符 表 的 人 口 地 址 

IsDebuggerPresent() 判断 调用 进程 是 否 处 于 被 调试 环境 中 

OutputDebugString() 将 一 个 字符 串 传递 给 调试 器 显示 

ReadProcessMemory() 读 取 指定 进程 的 某 区 域内 的 数据 

SetThreadContext() 设置 指定 线程 的 执行 环境 

WaitForDebugEvent() 等 待 被 调试 进程 发 生 调试 事件 

WriteProcessMemory() 在 指定 进程 的 某 区 域内 写 入 数据 


16.3.2 调试 事件 
调试 器 的 主要 工作 是 监视 目标 进程 的 执行 并 对 目标 进程 执行 过 程 中 发 生 的 每 一 个 调试 
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事件 进行 相应 的 响应 和 处 理 。 当 目标 进程 发 生 一 个 调试 事件 后 ,系统 将 会 通知 调试 器 来 处 
理 这 个 事件 ,调试 器 利用 WaitForDebugEvent() 函数 来 获取 目标 进程 中 发 生 的 调试 事件 信 
息 。 常 用 的 调试 事件 如 表 16-2 所 示 。 
表 16-2 调试 事件 

调试 事件 a x 
进程 被 创建 。 当 调试 的 进程 刚 被 创建 (还 未 运行 ) 或 调试 器 开 
始 调试 已 经 激活 的 进程 时 ,就 会 生成 这 个 事件 
在 调试 进程 中 创建 一 个 新 的 进程 或 调试 器 开始 调试 已 经 激活 


CREATE_THEAD_DEBUG_EVENT | 的 进程 时 ,就 会 生成 这 个 调试 事件 。 要 注意 的 是 , 当 调试 的 主 
线程 被 创建 时 不 会 收 到 该 通知 


EXCEPTION_DEBUG_EVENT 在 调试 的 进程 中 出 现 了 异常 ,就 会 生成 该 调试 事件 
EXIT_PROCESS DEBUG_EVENT 每 当 退 出 调试 进程 中 的 最 后 一 个 线程 时 ,产生 这 个 事件 


调试 中 的 线程 退出 时 事件 发 生 , 调 试 的 主线 程 退出 时 不 会 收 
到 该 通知 


每 当 被 调试 的 进程 装载 DLL 文件 时 ,就 生成 这 个 事件 。 当 
PE 装载 器 第 一 次 解析 出 与 DLL 文件 有 关 的 链接 时 ,将 收 到 
这 一 事件 。 调 试 进程 使 用 了 LoadLibrary 时 也 会 发 生 。 每 当 
DLL 文件 装载 到 地 址 空间 中 去 时 ,都 要 调用 该 调试 事件 


当 调 试 进程 调用 DebugOutputString 函数 向 程序 发 送 消息 字 
符 串 时 该 事件 发 生 


每 当 调试 进程 使 用 FreeLibrary RAER DLL 文件 时 ,就 会 生 
成 该 调试 事件 。 仅 当 最 后 一 次 从 过 程 的 地 址 空间 务 载 DLL 
文件 时 , 才 出 现 该 调试 事件 (也 就 是 说 DLL 文件 的 使 用 次 数 
为 0 时 ) 


只 有 Windows 98 检查 过 的 构件 才 会 生成 该 调试 事件 。 该 调 
试 事件 是 报告 错误 信息 


CREATE_PROCESS_DEBUG_EVENT 


EXIT_THREAD_DEBUG_EVENT 


LOAD_DLL_DEBUG_EVENT 


OUTPUT_DEBUG_STRING_EVENT 


UNLOAD_DLL_DEBUG_EVENT 


RIP_EVENT 


“4 WaitForDebugEvent ( ) 接收 到 一 个 调试 事件 时 ,会 把 调试 事件 的 信息 填写 人 
DEBUG_EVENT 结构 中 返回 ,然后 检查 dwDebugEventCode 字段 中 的 值 ,根据 它 来 判断 被 
调试 的 进程 中 发 生 了 哪 种 类 型 的 调试 事件 。 在 调试 事件 结构 体 中 ,dwProcessId 的 值 是 调 
试 事件 所 发 生 的 进程 的 标识 符 ,dwThreadId 的 值 是 调试 事件 所 发 生 的 线程 的 标识 符 , 最 后 
一 个 是 与 调试 事件 类 型 dwDebugEventCode 对 应 的 共用 体 成 员 。 


typedef struct DEBUG EVENT { 

DWORD dwDebugEventCode; 

DWORD dwProcessId; 

DWORD dwThreadId; 

union { 
EXCEPTION DEBUG INFO Exception; 
CREATE THREAD DEBUG INFO CreateThread; 
CREATE PROCESS DEBUG INFO CreateProcessInfo; 
EXIT THREAD DEBUG INFO ExitThread; 
EXIT PROCESS DEBUG INFO ExitProcess; 
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LOAD DLL DEBUG INFO LoadD117 
iOD -i — INFO UnloadD11; 
OUTEUT_DEBUG STRING INFO DebugString; 
RIP_INFO RipInfo; 
} u; 
} DEBUG EVENT; 
16.3.3 进程 调试 
实际 应 用 时 ,根据 不 同 的 需要 ,可 以 创建 一 个 新 的 进程 进行 调试 ,也 可 以 调试 一 个 正在 
运行 的 进程 ,不 管 哪 种 方式 ,都 需要 建立 循环 不 断 地 接收 和 处 理 调 试 事件 ,进行 相应 的 处 理 ， 
然后 等 待 下 一 个 调试 事件 的 触发 。 
1. 创建 一 个 新 进程 以 供 调试 
通过 CreateProcess( ) 创 建新 进程 时 ,如果 在 dwCreationFlags 标志 字段 中 设置 了 
DEBUG_PROCESS 或 DEBUG_ONLY_THIS_PROCESS 标志 ,将 创建 一 个 用 以 调试 的 新 
进程 。 
2. 调试 一 个 已 有 进程 
利用 DebugActiveProcess() 函 数 可 以 将 调试 器 拥 绑 到 一 个 正在 运行 的 进程 上 ,如 果 执 
行 成 功 , 则 效果 类 似 于 利用 DEBUG_ONLY_THIS_PROCESS 标志 创建 的 新 进程 。 要 注意 
的 是 ,在 NT 内 核 下 当 试 图 通过 DebugActiveProcess() 函 数 将 调试 器 拥 绑 到 一 个 创建 时 带 
有 安全 描述 符 的 进程 上 时 ,将 被 拒绝 。 
3. 建立 事件 监视 循环 
使 用 WaitForDebugEvent() 和 ContinueDebugEvent() 函 数 建立 循环 来 不 断 地 监视 调 
试 事件 。WaitForDebugEvent() 在 一 段 时 间 内 等 待 目标 进程 中 调试 事件 的 发 生 ,如 果 在 这 
段 时 间 没 有 调试 事件 发 生 , 那 么 函数 将 返回 False; 如 果 在 指定 时 间 内 调试 事件 发 生 了 ,那么 
函数 将 返回 True, 并 且 把 所 发 生 的 调试 事件 及 其 相关 信息 填写 入 一 个 DEBUG_EVENT 结 
构 。 然 后 调试 器 会 检查 这 些 信息 ,并 据 此 进行 相应 的 处 理 。 在 对 这 些 事件 进行 相应 的 操作 
后 ,就 可 以 使 用 ContinueDebugEvent() 函 数 来 恢复 线程 的 执行 ,并 等 待 下 一 个 调试 事件 的 
发 生 。 需 要 注意 的 是 ,WaitForDebugEvent() 只 能 使 用 在 创建 以 供 调试 的 或 是 已 被 拥 绑 调 
试 器 的 进程 中 的 某 个 线程 上 。 下 面 的 代码 以 C 语言 形式 演示 了 该 循环 的 构建 方式 。 
PROCESS_INFORMATION pi; 
STARTUP INFO si; 
DEBUG EVENT devent; 
if (CreateProcess (0, "target .exe", 0, 0, FALSE, DEBUG ONLY THIS PROCESS, 0,0, &si,pi)) 
{ 
while (TRUE) 
{ 
if (WaitForDebugEvent (&devent, 100) ) // 在 100ms 内 等 待 调试 事件 
{ 
switch (devent .dwDebugEventCode) 
{ 
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case CREATE PROCESS DEBUG EVENT: 
// 在 此 处 编写 自己 的 处 理 代 码 
break; 
case EXIT PROCESS DEBUG EVENT: 
// 在 此 处 编写 自己 的 处 理 代码 
break; 
case EXCEPTION DEBUG EVENT: 
// 在 此 处 编写 自己 的 处 理 代码 
break; 
// 其 他 类 型 调试 事件 处 理 代 码 
} 
ContinueDebugEvent (devent .dwProcessId, devent .dwIhreadId, DBG_CONTINUE) ; 
} 
else 
t 
// 其 他 一 些 操作 


MessageBox (0, "Unexpected load error","Fatal Error" ,MB OK); 
} 


16.3.4 线程 环境 


每 个 进程 都 有 一 个 最 初 的 主线 程 ,通过 主线 程 可 以 创建 在 同一 地 址 空间 中 运行 的 其 他 
线程 。 进 程 并 不 执行 代码 ,真正 执行 代码 的 是 线程 。 同 一 个 进程 中 的 所 有 线程 共享 相同 的 
地 址 空间 和 相同 的 系统 资源 ,但 是 每 个 线程 又 有 不 同 的 执行 环境 。 

Windows 分 配给 每 个 线程 一 个 很 短 的 时 间 片 ,时 间 片 用 完 之 后 ,系统 将 暂停 当前 线程 
并 切换 到 下 一 个 具有 最 高 优先 级 的 待 调度 线程 。 在 切换 之 前 ,系统 会 把 当前 线程 执行 状态 
保存 到 一 个 名 为 CONTEXT 的 结构 体 中 ,包括 线程 执行 所 用 寄存 器 、 系 统 堆栈 和 用 户 堆栈 、 
线程 所 用 的 描述 符 表 等 其 他 状态 信息 。 当 该 线程 再 次 被 调度 进入 CPU 运行 时 ,系统 将 恢 
复 上 次 保存 的 上 下 文 ,以 便 线程 可 以 继续 上 一 次 未 完成 的 工作 。 

在 调试 时 ,为 了 满足 某 些 特定 调试 目的 .也 可 以 根据 需要 来 读 取 和 修改 线程 环境 ,具体 
步 又 有 4 个 。 

(1) 调用 SuspendThread() 函数 暂停 线程 。 

(2) 调用 GetThreadContext() 函数 读 取 线程 环境 。 

(3) 修改 读 取 到 的 数据 ,再 调用 Set ThreadContext() 函数 设置 线程 新 的 执行 环境 。 

(4) 调用 ResumeThread() 函 数 恢复 线程 执行 。 


16.3.5 ER 
断 点 是 最 常用 的 软件 调试 技术 之 一 ,其 基本 思想 是 在 某 一 个 位 置 设置 一 个 “陷阱 ”, 当 
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CPU 执行 到 这 个 位 置 时 停止 被 调试 的 程序 并 中 断 到 调试 器 中 ,让 调试 者 进行 分 析 和 调试 ， 
调试 者 分 析 结 束 后 ,可 以 让 被 调试 程序 恢复 执行 。 通 过 设置 断 点 可 以 暂停 程序 执行 ,并 可 以 
观察 和 记录 指令 信息 、 变 量 值 ,堆栈 参数 和 内 存 数据 ,还 可 以 深入 了 解 和 把 握 程 序 执行 的 内 
部 原理 和 详细 过 程 , 断 点 对 于 软件 调试 具有 重要 的 意义 和 作用 。 

断 点 可 以 分 为 软件 断 点 、 硬 件 断 点 和 内 存 断 点 三 大 类 ,也 有 的 分 为 代码 断 点 .数据 断 点 
和 1/O 断 点 三 类 ,这 里 只 介绍 前 一 种 分 类 标准 。 

1. 软件 断 点 

软件 断 点 是 一 个 单字 节 指 令 (INT 3, 字 节 码 为 0xCC) ,可 以 在 程序 中 设置 多 个 软件 断 
点 ,使 得 程序 执行 到 该 处 时 能 够 暂停 执行 ,并 将 控制 权 转移 给 调试 器 的 断 点 处 理 函数 。 

当 调 试 器 被 告知 在 目标 地 址 设置 一 个 断 点 , 它 首先 读 取 目 标 地 址 的 第 一 个 字 节 的 操作 
码 , 然 后 保存 起 来 ,同时 把 地 址 存储 在 内 部 的 中 断 列 表 中 。 接 着 ,调试 器 把 一 个 字 节 操作 码 
0xCC 写 人 刚才 的 地 址 。 当 CPU 执行 到 0xCC 操作 码 时 就 会 触发 一 个 INT 3 中 断 事件 ,此 
时 调试 器 就 能 捕捉 到 这 个 事件 。 调 试 器 继续 判断 这 个 发 生 中 断 事件 的 地 址 (通过 指令 指针 
寄存 器 EIP) 是 不 是 自己 先前 设置 断 点 的 地 址 。 如 果 在 调试 器 内 部 的 断 点 列表 中 找到 了 这 
个 地 址 ,就 将 设置 断 点 前 存储 起 来 的 操作 码 写 回 到 目标 地 址 ,这 样 进程 被 调试 器 恢复 后 就 能 
正常 执行 。 

2. 硬件 断 点 

硬件 断 点 通过 调试 寄存 器 实现 ,设置 在 CPU 级 别 上 , 当 需 要 调试 某 个 指定 区 域 而 又 无 
法 修改 该 区 域 时 ,硬件 断 点 非常 有 用 。 

一 个 CPU 一 般 会 有 8 个 调试 寄存 器 (DR0 一 DR7) ,用 于 管理 硬件 断 点 。 其 中 调试 寄存 
器 DRO 到 调试 寄存 器 DR3 存储 硬件 断 点 地 址 ,同一 时 间 内 最 多 只 能 设置 4 个 硬件 断 点 ; 
DR4 和 DRS 保留 ,DR6 是 状态 寄存 器 ,说 明 被 断 点 触发 的 调试 事件 的 类 型 ;DR7 本 质 上 是 
一 个 硬件 断 点 的 开关 寄存 器 ,同时 也 存储 了 断 点 的 不 同类 型 。 通 过 在 DR7 寄存 器 里 设置 不 
同 标志 ,能 够 创建 以 下 几 种 断 点 当 特定 的 地 址 上 有 指令 执行 时 中 断 、 当 特定 的 地 址 上 有 数 
据 写 和 人 时 、 当 特定 的 地 址 上 有 数据 读 或 者 写 但 不 执行 时 。 

硬件 断 点 使 用 INT 1 实现 ,该 中 断 负责 硬件 中 断 和 步 进 事件 。 步 进 是 指 根据 预定 的 流 
程 一 条 一 条 地 执行 指令 ,每 执行 完 一 条 指令 后 暂停 下 来 ,从 而 可 以 精确 地 观察 关键 代码 并 监 
视 寄存 器 和 内 存 数据 的 变化 。 在 CPU 每 次 执行 代码 之 前 ,都 会 先 确认 当前 将 要 执行 代码 
的 地 址 是 否 是 硬件 断 点 的 地 址 ,同时 也 要 确认 是 否 有 代码 要 访问 被 设置 了 硬件 断 点 的 内 存 
区 域 。 如 果 任 何 储存 在 DRO~ DRS 中 的 地 址 所 指向 的 区 域 被 访问 了 ,就 会 触发 INT 1 中 
断 , 同 时 暂停 CPU; 如 果 不 是 中 断 地 址 则 CPU 执行 该 行 代码 ,到 下 一 行 代 码 时 ,CPU 继续 
重复 上 面 的 过 程 。 

3. 内 存 断 点 

内 存 断 点 是 通过 修改 内 存 中 指定 块 或 页 的 访问 权限 来 实现 的 。 通 过 将 指定 内 存 块 或 页 
的 访问 权限 属性 设置 为 受 保护 的 , 则 任何 不 符合 访问 权限 约束 的 操作 都 将 失败 ,并 抛 出 异 
常 ,导致 CPU 暂停 执行 ,使 得 调试 器 可 以 查看 当前 执行 状态 。 

一 般 来 说 ,每 个 内 存 块 或 页 的 访问 权限 都 由 3 种 不 同 的 访问 权限 组 成 : 是 否 可 执行 .是 
否 可 读 、 是 否 可 写 。 每 个 操作 系统 都 提供 了 用 来 查询 和 修改 内 存 页 访问 权限 的 函数 ,在 
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Windows 操作 系统 中 可 以 使 用 VirtualProtect() 函 数 来 修改 主 调 进 程 虚拟 地 址 空间 中 已 提 
交 页 面 的 保护 属性 ,使 用 VirtualProtectEx() 函 数 可 以 修改 其 他 进程 虚拟 地 址 空间 页 面 的 
保护 属性 。 


16.4 案例 精 选 


本 节 中 通过 一 些 示 例 来 演示 如 何 使 用 Python 编写 程序 分 析 PE 文件 ,其 中 用 到 了 不 同 
的 扩展 库 , 请 根据 需要 下 载 安 装 。 
1. 利用 pefile 模块 查看 PE 文件 详细 信息 


>>> import pefile 
>>> f =pefile.PE (r'C:\windows\notepad.exe') 
>>>print (f) 
>>>print (f.FILE_HEADER) 
>>>print (f.OPTIONAL HEADER) 
>>> for k in f.sections: 
print (k) 
>>> £.is_dll() 
False 
>>> £.is_exe() 


True 
2. 利用 pefile 模块 枚 举 DLL 的 导出 项 


>>> import pefile 
>>> pe =pefile. PE (r'C:\windows\glut32.d11"') 
>>> if hasattr (pe, 'DIRECTORY_ENTRY_EXPORT') : 
for exp in pe.DIRECTORY_ENTRY_EXPORT.symbols: 
print (hex (pe .OPTIONAL HEADER. ImageBaset+ exp.address) , \ 
exp.name, exp.ordinal) 


3. 利用 pefile 和 pydasm 模块 从 PE 文件 入 口 点 开始 反 汇 编 


import pefile 
import pydasm 
import sys 


pe =pefile. PE (r"C:\windows\notepad.exe") 


console =sys.stdout 


f =open('pe_dasm.txt', 'w') 


sys.stdout =£ 


ep =pe.OPTIONAL _HEADER.AddressOfEntryPoint 
ep_ava = ep +pe.OPTIONAL HEADER. ImageBase 
data =pe.get_memory mapped image () [ep:] 
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while offset < len (data): 
i =pydasm.get_instruction (data[offset:], pydasm.MODE 32) 
instruction =pydasm.get_instruction_string(i, pydasm.FORMAT INTEL, ep avatoffset) 
if instruction !=None: 


print (hex (ep +offset), '\t', instruction) 


offset +=i.length 


except BaseExceptionase: 


sys.stdout =console 
4. 利用 WinAppDbg 监视 Windows API 调 用 


from winappdbg import Debug, EventHandler 


class MyEventHandler ( EventHandler ) : 
#Add the APIs you want to hook 
apiHooks = {'kernel132.dl1' : [( 'CreateFileW', 7)]} 


#The pre_ functions are called upon entering the API 
def pre_CreateFileW(self, event, ra, lpFileName, dwDesiredAccess, 
dwShareMode, lpSecurityAttributes, dwCreationDisposition, 
dwFlagsAndAttributes, hTemplateFile) : 
fname = event .get_process() -peek_string(lpFileName, fUnicode=True) 


print "CreateFilew: $% 


#The post_ functions are called upon exiting the API 
def post_CreateFileW(self, event, retval): 


print 'Suceeded (handle value: sx) ' $% (retval) 


print 'Failed!' 


if name _ 
if len(sys.argv) <2 or not os.path.isfile(sys.argv[1]): 
print "\nUsage: $s <File to monitor> [argl, arg2, ...]\n" $sys-argv[0] 


# Instance a Debug object, passing it the MyEventHandler instance 
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debug = Debug( MyEventHandler () ) 
try: 
#Start a new process for debugging 
p =debug.execv(sys-argv[1:], bFollow=True) 
#Wait for the debugged process to finish 
debug loop () 
# Stop the debugger 
finally: 
debug. stop () 


将 上 面 的 代码 保存 为 simpleapi. py, 使 用 方法 与 运行 结果 如 图 16-7 所 示 。 


ti a 
版 权 所 有 <e> ien Ice ia 保留 所 有 权利 。 


:Windows\systen32)cd\python27 


Patient Tastin sinpleAPl .py c:\windows \notepad.exe a.txt 
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图 16-7 Windows API 监视 器 


本 章 小 结 


(1) 在 Windows 平 台 上 ,exe 文 件 .com 文件 .dll 文件 .ocx 文件 ,sys 文件 和 ser 文件 等 
都 属于 PE 文件 。 

(2) PE 文件 规范 最 新 版 本 是 2013 年 2 月 6 日 发 布 的 8.3 版 。 

(3) 在 分 析 软 件 尤其 是 恶意 软件 时 ,应 尽量 使 用 虚拟 机 或 沙 箱 系统 ,避免 本 地 物理 主机 
系统 被 感染 而 造成 不 必要 的 损失 。 

(4) IDA, W32DASM 是 成 熟 的 可 执行 文件 反 汇编 工具 ,OllyDbg、WinDbg 和 Immunity 
Debugger 是 成 熟 的 软件 调试 工具 。 

(5) 通过 IDAPython 插件 可 以 在 IDA 中 运行 Python 程序 实现 自 定义 的 软件 测试 与 分 
析 功 能 。 

(6) ROP、JOP 是 近 几 年 流行 的 攻击 方式 ,目前 比较 有 效 的 防范 技术 是 CFI 

(7) 软件 调试 时 经 常 需要 设置 断 点 ,常见 的 断 点 类 型 有 软件 断 点 、 硬 件 断 点 和 内 存 断 点 。 

(8) 调试 器 的 主要 工作 就 是 监视 目标 进程 的 运行 并 对 目标 执行 过 程 中 发 生 的 每 一 个 调 
试 事件 进行 相应 的 反应 和 处 理 。 


习 a 
1. 下 载 PE 文件 规范 8. 3 版 本 ,并 尝试 了 解 PE 文件 的 基本 结构 。 


2. 下 载 并 安装 IDA Pro 与 Immunity Debugger, 并 简单 了 解 PE 文件 反 汇编 和 调试 步骤 。 
3. 安装 并 配置 IDAPython 插件 ,然后 运行 本 章 16. 2. 1 WAY Python 代码 。 
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4. 在 Immunity Debugger 调试 器 中 运行 本 章 16. 2. 2 节 中 的 代码 。 
5. 叙述 软件 调试 断 点 的 概念 .作用 及 其 分 类 。 
6. 运行 16.4 节 中 的 代码 并 查看 运行 结果 。 
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第 17 章 ”科学 计算 与 可 视 化 


用 于 科学 计算 与 可 视 化 的 Python 模块 非常 多 ,例如 NumPy, SciPy, SymPy, Pandas, 
Matplotlib, Traits, TraitsUI, Chaco, TVTK, Mayavi, VPython 和 OpenCV。 其 中 , NumPy 
模块 是 科学 计算 包 ,提供 了 Python 中 没有 的 数组 对 象 , 支 持 N 维 数组 运算 、 处 理 大 型 矩阵 、 
成 熟 的 广播 函数 库 、 矢 量 运算 、 线 性 代数 、 傅 里 叶 变 换 以 及 随机 数 生成 等 功能 ,并 可 与 C++ 、 
FORTRAN 等 语言 无 缝 结合 。SciPy 模块 依赖 于 NumPy, 提 供 了 更 多 的 数学 工具 ,包括 矩 
阵 运算 ,线性 方程 组 求解 积分 和 优化 等 。Matplotlib 是 比较 常用 的 绘图 模块 ,可 以 快速 地 
将 计算 结果 以 不 同类 型 的 图 形 展示 出 来 。 如 果 您 需要 了 解 更 多 科学 计算 与 可 视 化 模块 ,以 
及 其 他 模块 ,可 以 参考 网 页 http://www. lfd. uci. edu/ 一 gohlke/pythonlibs/ ,下 载 whl 文件 
后 使 用 pip 安装 。 


17.1 NumPy 简单 应 用 


根据 Python 社区 的 习惯 ,可 以 使 用 下 面 的 方式 来 导入 NumPy 模块 : 
>>> import numpy as np 
1. 生成 数组 


>>>a =np.array ((1,2,3,4,5)) 

>>>b =np.array (([1,2,3], [4,5, 6], [7,8,9])) 
>>>x =np.linspace (0,5,10) 

>>> y =np.logspace (0, 100,10) 


2. 数组 与 数值 的 算术 运算 


>>>a=np.array((1,2,3,4,5)) 
>>>a* 2 

array([ 2, 4, 6, 8, 10]) 

>>>a/2 

array ([0, 1, 1, 2, 2]) 

>>>a/2.0 

array([ 0.5, 1. , 1.5, 2. , 2.5]) 
>>> axx2 


array([ 1, 4, 9, 16, 25]) 
3. 数组 与 数组 的 算术 运算 


>>>a =np-array((1,2,3)) 
>>>b =np.array (([1,2,3], [4,5,6],[7,8,9])) 


>>>c =a*b 
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>>>print (c) 
[[149] 
[41018] 
[716 27]] 
>>>Print (c/b) 
[[123] 
[123] 
[1 2 3]] 
>>>a =np.array ((1,2,3)) 
>>>b =np.array ((1,2,3)) 
>>>a*b 
array ([1, 4, 9]) 
>>>atb 
array ([2, 4, 6]) 


4. 二 维 数组 转 置 


>>>b =np.array (([1,2,3], [4,5,6], [7,8,9])) 
>>> print (b.T) 
[147] 

[258] 

[3 6 9]] 


5. 向 量 点 积 


>>> import numpy as np 
>>> a=np.array ((5,6,7)) 
>>> b=np.array ( (6, 6, 6) ) 
>>> print (np.dot (a,b) ) 
108 


6. 数组 元 素 访问 


>>> import numpy as np 

>>>b =np.array (([1,2,3], [4,5, 6], [7,8,9])) 
>>>b[0,0] 

1 

>>>b[0] [2] 

3 


数组 还 支持 多 元 素 同 时 访问 ,例如 : 


>>>x =np.arange (0,100, 10, dtype=np. floating) 


>>>x 


array([ 0., 10., 20., 30., 40., 50., 60., 70., 80 


>>> index =np.random.randint (0, len (x) ,5) 
>>> index 
array([9, 6, 3, 9, 7]) 


>>>noise =np.random. standard normal (5) * 0.3 


+1 90.1) 


>>>noise 

array ([ 0.43460475, 0.57262955, —0.15114837, 0.02738525, ~ 0.01063617]) 
>>>x[index] 

array([ 90., 60., 30., 90., 70.1) 

>>>x[index] +=noise 

>>>x [index] 

array ([ 90.02738525, 60.57262955, 29.84885163, 90.02738525, 69. 98936383] ) 
>>>x[[1,3,5]] 


array ([ 10. , 29.84885163, 50. D 
7. 三 角 函 数 运算 
>>>b =np.array(([1,2,3], [4,5,6], [7,8,9])) 
>>> print (np.sin (b) ) # 输 出 结果 ( 略 ) 
8. MEA 
>>>print (np.round (np.sin (b) )) 

[[1. 1. 0.] 

| 

[1. 1. 0.]] 


9 对 矩阵 不 同 维度 上 的 元 素 进 行 求 和 


>>>x =np.arange (0,10) .reshape (2, 5) 
>>>x 
array([[0, 1, 2, 3, 4], 
[5, 6, 7, 8, 9]]) 
>>> np.sum (x) 
45 
>>>np.sum(x, axis=0) 
array([ 5, 7, 9, 11, 13]) 
>>>np.sum(x, axis=1) 
array ([10, 35]) 


10. 计算 矩阵 不 同 维度 上 元 素 的 均值 


>>>x =np.arange (0,10) .reshape (2, 5) 
>>>np.average (x, axis =0) 

array([ 2.5, 3.5, 4.5, 5.5, 6.5]) 
>>> np.average (x, axis=1) 


array([ 2., 7-1) 
11. 计算 数据 的 标准 差 与 方差 


>>>x =np.random.randint (0, 10, size= (3,3)) 
>>>x 
array([[4, 2, 8], 

[0, 8, 9], 

(0, 2, 7]]) 
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>>>np.std (x) 
3.4029761846919007 

>>> np. std (x,axis=1) 

array ([ 2.49443826, 4.02768199, 2.94392029]) 
>>> np.var (x) 

11.580246913580245 


12. 对 和 矩阵 不 同 维度 上 的 元 素 求 最 大 值 


>>>np.max (x) 

9 

>>> np.max (x, axis=1) 
array ([8, 9, 7]) 


13. 对 和 矩阵 不 同 维度 上 的 元 素 进行 排序 


>>> np.sort (x) 
array ([[2, 4, 8], 

[0, 8, 9], 

(0, 2, 711) 
>>>np.sort (x,axis=0) 
array ([[0, 2, 7], 

[0, 2, 8], 

(4, 8, 9]]) 


14. 生成 特殊 数组 


>>> print (np.zeros((3,3))) 
[[0. 0. 0.] 
[0. 0. 0.] 
[0. 0. 0.]] 
>>> print (np.ones((3,3))) 
[[1. 1. 1.] 
[1. 1. 1.] 
[1. 1. 1.]] 
>>>print (np.identity (3) ) 
[E 1. 0. 0.) 
poii 0i 
[0. 0. 1.]] 
>>>np.empty ( (3, 3) ) # 只 申请 空间 ,不 初始 化 ,速度 很 快 
array([[ 4.24510694e+ 175, 5.03061214e+ 223, 4.72100120e+ 164], 
[ 2.63551414e- 144, —1.00000000e+ 000, 0.00000000e+ 000], 
[ 0.00000000e+ 000, 0.00000000e+ 000, 1.00000000e+ 000] ]) 


15. 改变 数组 大 小 


>>>a =np.arange(1,11,1) 
>>>a 


array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) 


>>>a.shape =2,5 
>>>a 
array([[1, 2, 3, 4, 5], 
[6, 7, 8, 9, 10]]) 
>>>a.shape =5,-1 #-1 工 表示 自动 计算 
>>>a 
array([[ 1, 2], 
[3,4], 
[5, 6], 
[7, 8], 
[ 9, 10]]) 
>>>b =a.reshape (2,5) 
>>>b 
array ([[ 1, 2, 3, 4, 5], 
[ 6, 7, 8, 9, 10]]) 


16. 切片 操作 


>>>a =np.arange (10) 

>>>a 

array ([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 
>>>a[::-1] 

array ([9, 8, 7, 6, 5, 4, 3, 2, 1, 0]) 
>>>a[z:2] 

array([0, 2, 4, 6, 8]) 

>>>a[:5] 


N 


array ([0, 1, 2, 3, 4]) 
>>>c=np.array([[j* 10+ i for i in range (6)] for j in range (6) ]) 
>>>c[0,3:5] 
array ([3, 4]) 
>>>c[0] 
array([0, 1, 2, 3, 4, 5]) 
>>> c[2:5, 2:5] 
array ([[22, 23, 24], 
(32, 33, 34], 
[42, 43, 44]]) 


17. 布尔 运算 


>>>x =np. random. rand (10) 

>>>x 

array ([ 0.93874098, 0.97312716, 0.45264749, 0.74117525, 0.89758246, 
0.29755703, 0.2182093 , 0.5673035 , 0.90745768, 0.71920431]) 

>>>x>0.5 


array([ True, True, False, True, True, False, False, True, True, True], dtype=bool) 


>>>x [> 0.5] 
array ([ 0.93874098, 0.97312716, 0.74117525, 0.89758246, 0.5673035 , 
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0.90745768, 0.71920431]) 
>>>np.array ([1,2,3]) <np.array ([3,2,1]) 
array([ True, False, False], dtype=bool) 


>>> np.array([1,2,3]) ==np.array(([3,2,1]) 
array([False, True, False], dtype=bool) 


18. 取 整 运算 


>>>x =np.random. rand (10) * 50 

>>>x 

array ([ 0.69708323, 14.99931488, 15.04431214, 24.60547929, 
12.12020273, 42.72638176, 16.01128916, 38.91558471, 
39.6877989 , 21.98678429]) 

>>>np.array ([t- int (t) for t in x]) 

array ([ 0.69708323, 0.99931488, 0.04431214, 0.60547929, 0.12020273, 
0.72638176, 0.01128916, 0.91558471, 0.6877989 , 0.98678429]) 


19, 广播 


>>> a =np.arange (0, 60,10) .reshape (- 1,1) 
>>>b =np.arange (0, 6) 
>>>atb 
array([[ 0, 1, 2,3, 4, 5), 
(10, 11, 12, 13, 14, 15], 
[20, 21, 22, 23, 24, 25], 
[30, 31, 32, 33, 34, 35], 
[40, 41, 42, 43, 44, 45], 
[50, 51, 52, 53, 54, 55]]) 


20. 分 段 函数 


>>>x =np.random. randint (0, 10, size= (1,10)) 

>>>x 

array([[0, 4, 3, 3, 8, 4, 7, 3, 1, 7]]) 

>>> np.where (x< 5,0,1) 

array([[0, 0, 0, 0, 1, 0, 1, 0, 0, 1]]) 

>>> x =np.random.randint (0, 10, size= (1,10)) 

>>>x 

array([[3, 6, 5, 1, 0, 7, 3, 9, 6, 0]]) 

>>> np.piecewise (x, [x> 7,x< 4], [lambda x:x * 2, lambda x:x * 3,0]) 
array([[ 9, 0, 0, 3, 0, 0, 9, 18, 0, 0]]) 


21. 计算 唯一 值 以 及 出 现 次 数 


>>>x =np.random. randint (0, 10, 10) 
>>>x 
array([4, 7, 3, 6, 7, 4, 1, 9, 4, 8]) 


>>>np-bincount (x) 


array([0, 1, 0, 1, 3, 0, 1, 2, 1, 1]) 
>>>np.unique (x) 
array([1, 3, 4, 6, 7, 8, 91) 


22. 计算 加 权 平 均值 


>>>x =np.random.randint (0,10, 10) 
>>>x 

array ([7, 8, 5, 8, 0, 7, 9, 9, 9, 7]) 

>>>y =np.array([round(i,1) for i in list (np. random. random (10) ) ] ) 
>>>y 

array([ 0.6, 0.8, 0.8, 0. , 0.6, 0.1, 0. , 0.2, 0.8, 0.7]) 
>>>np.sum(x* y) /np.sum(np.bincount (x) ) 


2.9199999999999999 
23. 和 矩阵 运算 


>>> import numpy as np 
>>>a_list = [3,5,7] 

>>>a mat =np.matrix(a_list) 
>>>a mat 

matrix ([[3, 5, 7]]) 
>>>np.shape (a_mat) 

(1, 3) 

>>>b_mat =np.matrix((1,2,3)) 
>>>b_mat 

matrix([[1, 2, 3]]) 

>>>a_mat * b mat.T 

matrix ([[34]]) 

>>>a_mat .argsort () # 返 回 每 个 元 素 的 排序 序号 
matrix([[0, 1, 2]]) 

>>> a_mat .mean () 

5.0 

>>> a_mat.sum() 

15 

>>> a_mat..max () 
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17.2 SciPy 简单 应 用 


SciPy 是 在 NumPy 的 基础 上 增加 了 大 量 用 于 数学 计算 、 科 学 计算 以 及 工程 计算 的 模 
块 ,包括 线性 代数 、 常 微分 方程 数值 求解 信号 处 理 ` 图 像 处 理 和 稀 朴 矩阵 等 。SciPy 主要 模 
块 如 表 17-1 所 示 。 
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表 17-1 SciPy 主要 模块 


模 块 说 明 
constants 常数 
special 特殊 函数 
optimize 数值 优化 算法 ,如 最 小 二 乘 拟 合 (leastsq) 、 函 数 最 小 值 (fmin RA) AE Be HE D BOR e 
(fsolve) 等 
interpolate | 插值 (interpld ,interp2d 等 ) 
integrate 数值 积分 
signal 信号 处 理 
图 像 处 理 , 包 括 filters 滤波 器 模块 fourier 傅 里 叶 变 换 模 块 interpolation 图 像 插值 模块 、 
ndimage measurements 图 像 测 量 模块 .morphology 形态 学 图 像 处 理 模块 等 
stats 统计 
17.2.1 常数 与 特殊 函数 


SciPy 的 constants 模块 包含 了 大 量 用 于 科学 计算 的 常数 ,详情 可 以 查看 http://docs. 
scipy. org/doc/scipy/reference/constants. html。 


可 以 使 用 下 面 的 方法 来 访问 该 模块 中 预定 义 的 常数 : 


>>> from scipy import constants as C 


>>>C.c # 真 空中 的 光速 
299792458.0 

>>>C.h # 普 朗 克 常 数 
6.62606896e- 34 

>>>C.mile # 一 英里 等 于 多 少 米 
1609.3439999999998 

>>>C.inch # 一 英寸 等 于 多 少 米 
0.0254 

>>>C.degree # 一 度 等 于 多 少 弧度 
0.017453292519943295 

>>>C.minute # 一 分 钟 等 于 多 少 秒 
60.0 


此 外 ,SciPy 模块 的 special 模块 包含 大 量 函 数 库 ,包括 基本 数学 函数 、 特 殊 函数 以 及 
NumPy 中 的 所 有 函数 。 


>>> from scipy import special as S 


>>>x = [0, np.pi/2, np.pi, np.pi* 1.5, np.pi* 2] 


>>>S.sin (x) 
array ([ 0.00000000e+ 00, 1.00000000e+ 00, 1.22464680e- 16, 


—1.00000000e+ 00, - 2.44929360e- 16] ) 


>>>x =[1, 2+3j, 4-53] 
>>> S.conjugate (x) ett ERR 
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array([ 1.-0.j, 2.-3.j, 4.+5.j]) 
>>> S.gamma (4) # gamma 函数 
6.0 


17.2.2 SciPy 简单 应 用 


中 值 滤 波 是 数字 信号 处 理 、 数 字 图 像 处 理 中 常用 的 预 处 理 技术 。 该 技术 的 特点 是 将 信 
号 中 每 个 值 都 蔡 换 为 其 邻 域内 的 中 值 , 即 邻 域内 所 有 值 排序 后 中 间 位 置 上 的 值 。 下 面 通 过 
两 个 示例 来 演示 SciPy 模块 中 中 值 滤波 的 实现 和 应 用 。 


>>> import random 

>>> import numpy as np 

>>> import scipy.signal as signal 
>>> x =np.arange (0,100, 10) 

>>> random. shuffle (x) 


>>>x 
array([40, 0, 60, 20, 50, 70, 80, 90, 30, 10]) 
>>> signal .medfilt (x, 3) # 中 值 滤波 


array([ 0.，40.，20.，50.，50.，70.，80.，80.，30.，10.]) 
下 面 的 代码 使 用 中 值 滤波 实现 了 信号 去 噪 ,并 将 处 理 前 后 的 信号 值 进行 了 对 比 ; 


import numpy as np 

import scipy.signal as signal 
x=np.arange(0,6,0.1) 

y =np.sin (x) 

z =y.copy() 

print ('=' * 20) 

print ("y:') 

print (y) 

print ('=' * 20) 

print ("before adding noise.z- y:"') 
print (z- y) 

index =np. random. randint (0, len (x) , 20) 
noise =np.random.standard_ normal (20) * 0.8 
z[index]+=noise 

print ('=' * 20) 

print ("after adding noise.z-y:') 
print (z- y) 

result =signal.medfilt (z,3) 

print ('=' * 20) 

print ('after median filtering.z-y:") 


print (result- y) 


运行 程序 可 以 看 到 ,经 过 中 值 滤波 处 理 之 后 ,信号 整体 更 加 接近 原始 值 ,但 同时 也 导致 
了 一 些微 小 的 失真 。 
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17.3 Matplotlib 案例 精 选 


Matplotlib 模块 依赖 于 NumPy 模块 和 tkinter 模块 ,可 以 绘制 多 种 形式 的 图 形 ,包括 线 


图 、 直 方 图 、 饼 状 图 、 散 点 图 和 误差 线 图 等 ,是 计算 结果 可 视 化 的 重要 工具 。 
17.3.1 绘制 带 有 中 文 标签 和 图 例 的 正弦 余弦 曲线 
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import numpy as np 
import pylab as pl 
import matplotlib import font_manager as fm 


myfont= fm.FontProperties (fname= r'C:\Windows\Fonts\STKAITI.ttf') # 设 置 字体 
t=np.arange (0.0, 2.0* np.pi, 0.01) # 自 变量 取 值 范围 
s=np.sin(t) # 计 算 正 弦 函 数值 
z=np.cos(t) # 计 算 余 弦 函 数值 


pl.plot (t, s, label='"IE%%') 

pl.plot (t, z, label= ' 余 弦 ') 

pl.xlabel ('x-484it', fontproperties='STKAITI', fontsize=24) # 设 置 x 标签 
p1L.Ylabel('y- 正 弦 余 弦 函 数值 '，fontproperties= 'STKAITI', fontsize=24) 
pl.title('sin- cos 函数 图 像 '，fontproperties= 'STKRAITI'，fontsize=32)  # 图 形 标 题 
pl.legend (prop=myfont) # 设 置 图 例 
pl.show() 


运行 结果 如 图 17-1 所 示 。 


sin-cos dh $¢ 1 1% 
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图 17-1 带 有 中 文 标签 和 图 例 的 正弦 余弦 曲线 


计算 与 可 视 化 


17.3.2 绘制 散 点 图 


>>>a =np.arange(0, 2.0* np.pi, 0.1) 
>>>b =np.cos (a) 
>>>pl.scatter (a,b) 


>>>pl.show () 


运行 结果 如 图 17-2 所 示 。 
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图 17-2 绘制 余弦 曲线 散 点 图 
下 面 的 代码 使 用 随机 数 生成 数值 ,并 根据 数值 大 小 来 计算 散 点 的 大 小 。 


>>> import matplotlib.pylab as pl 

>>> import numpy as np 

>>> x =np.random. random (100) 

>>> y =np.random. random (100) 

>>>pl.scatter (x, y,s=x * 500,c=u'r',marker=u' * ') #s 指 大 小 ,c 指 颜色 ,marker 指 符号 形状 
>>>pl.show() 


运行 结果 如 图 17-3 所 示 o 
17.3.3 绘制 饼 状 图 


import numpy as np 
import matplotlib.pyplot as plt 


# The slices will be ordered and plotted counter- clockwise. 
labels='Frogs', "Hogs", "Dogs", 'Logs' 

sizes= [15, 30, 45, 10] 

colors=['yellowgreen', 'gold', '#FF0000', 'lightcoral'] 

explode= (0, 0.1, 0, 0.1) #only "explode" the second and fourth slice 


fig=plt.figure() 
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图 17-3 绘制 星 形 散 点 图 


ax=fig.gca() 
ax.pie (np.random.random(4), explode=explode, labels= labels, colors=colors, 
autopct= ' 1.1f% % ', shadow=True, startangle=90, 
radius=0.25, center= (0, 0), frame=True) 
ax.pie (np.random.random(4), explode=explode, labels= labels, colors=colors, 
autopct='% 1.1f% % ', shadow=True, startangle=90, 
radius= 0.25, center= (1, 1), frame=True) 
ax.pie (np.random.random(4), explode=explode, labels= labels, colors=colors, 
autopct='% 1.1f% % ', shadow=True, startangle=90, 
radius=0.25, center= (0, 1), frame=True) 
ax.pie (np. random. random(4), explode=explode, labels= labels, colors=colors, 
autopct='% 1.1f% % ', shadow=True, startangle=90, 
radius=0.25, center= (1, 0), frame=True) 
.set xticks([0, 1]) 
.Set yticks([0, 1]) 
.set xticklabels(["Sunny", "Cloudy"]) 
.set yticklabels(["Dry", "Rainy"]) 
.set xlim((-0.5, 1.5)) 
ax.set ylim((-0.5, 1.5)) 


RRR BB 


#Set aspect ratio to be equal so that pie is drawn as a circle. 
ax.set_aspect ('equal') 


plt.show() 
程序 运行 结果 如 图 17-4 所 示 o 
17.3.4 使 用 pyplot 绘制 ,多 个 图 形 在 一 起 显示 


import numpy as np 
import matplotlib.pyplot as plt 
x =np.linspace(0, 2* np.pi, 500) 
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Rainy 


Dry 


Sunny Cloudy 
17-4 绘制 饼 状 图 


Y=np.sin(x) 

z =np.cos (x * x) 

plt.figure (figsize= (8, 4)) 

# 标 签 前 后 加 $ 将 使 用 内 嵌 的 Latex 引擎 将 其 显示 为 公式 

plt.plot (x,y, label= '$sin(x)$',color='red',linewidth=2) # 红 色 ,2 个 像素 宽 
plt.plot (x, Z, "b--', label= '$ cos (x^2) $ ') # 蓝 色 ,虚线 
plt.xlabel ('Time (s) ') 

plt.ylabel ('Volt') 

plt.title('Sin and Cos figure using pyplot') 

plt.ylim(-1.2,1.2) 

plt. legend () # 显 示 图 示 
plt.show () # 显 示 绘 图 窗口 


上 面 的 代码 运行 结果 如 图 17-5 所 示 。 


sin and cos figure using pyplot 


17-5 ”同时 绘制 多 个 图 形 
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17.3.5 使 用 pyplot 绘制 ,多 个 图 形 单独 显示 


import numpy as np #choose axl 

import matplotlib.pyplot as plt plt.sca (ax1) 
x=np.linspace (0, 2* np.pi, 500) #draw the curve in axl 
yl =np.sin(x) plt.plot (x, yl,color= 'red') 
y2 =np.cos (x) plt.ylim(-1.2,1.2) 

y3 =np.sin(x* x) # choose ax2 

# create figure plt.sca (ax2) 

plt. figure (1) plt.plot (x, y2, 'b--') 
# create three axes plt.ylim(-1.2,1.2) 

# first line, first column # choose ax3 

axl =plt.subplot (2,2,1) plt.sca (ax3) 

# first line, second column Plt.plot (x, y3, 'g-- ') 
ax2 =plt.subplot (2,2,2; plt.ylim(-1.2,1.2) 

# the whole second line plt.legend() 

ax3 =plt.subplot (2,1,2) plt.show() 


运行 结果 如 图 17-6 所 示 。 
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图 17-6 绘制 多 个 图 形 


17.3.6 绘制 三 维 图 形 


import numpy as np 
import matplotlib.pyplot as plt 
import mpl_toolkits.mplot3d 
2:20j，- 2:2:20j] 


x,y =np.mgrid[— 
z=50 * np.sin(xty) 

ax =plt.subplot (111, projection= '3d") 
ax.plot_surface(x,y,z,rstride=2, cstride=1, cmap=plt.cm.Blues_r) 
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ax.set_xlabel ('X') 
ax.set_ylabel ('Y') 
ax.set_zlabel('Z') 
plt.show() 


运行 结果 如 图 17-7 所 示 ,在 绘图 窗口 中 可 用 鼠标 来 旋转 所 绘制 图 形 。 


图 17-7 三 维 图 形 
下 面 的 代码 绘制 了 另 一 个 略 加 复杂 的 三 维 图 形 : 


import pylab as pl 

import numpy as np 

import mpl toolkits.mplot3d 
rho, theta =np.mgrid[0:1:40j, 0:2* np.pi:40j] 
z =rhox*2 

x =rho* np.cos (theta) 

y =rho* np.sin (theta) 

ax =pl.subplot (111, projection= '3d') 
ax.plot_surface (x,y,z) 


pl.show() 
运行 结果 如 图 17-8 所 示 。 
17.3.7 绘制 三 维 曲线 


下 面 的 代码 演示 了 如 何 绘制 三 维 参数 
曲线 。 


import matplotlib as mpl 


from mpl_toolkits.mplot3d import Axes3D 


1.0 -1.0 


图 17-8 绘制 三 维 图 形 


import numpy as np 
import matplotlib.pyplot as plt 
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mpl.rcParams['legend.fontsize']=10 


fig=plt.figure() 


ax=fig.gca (projection='3d') 


theta=np.linspace(-4 * np.pi, 4 * np.pi, 100) 


z=np.linspace(—4, 4, 100) * 0.3 


r=2** 341 


x=r * np.sin(theta) 


y=r * np.cos (theta) 


ax.plot (x, y, Z, label= ‘parametric curve') 


ax. legend () 


plt.show() 


程 上 


这 运行 结果 如 图 17-9 所 示 。 
[Emrememe curve] 


图 17-9 绘制 三 维 参数 曲线 


17.4 数据 分 析 模 块 pandas 


pandas(Python Data Analysis Library) 是 基于 NumPy 的 数据 分 析 模 块 ,提供 了 大 量 标 
准 数据 模型 和 高 效 操作 大 型 数据 集 所 需要 的 工具 ,可 以 说 pandas 是 使 得 Python 能 够 成 为 


高 效 目 


强大 的 数据 分 析 环 境 的 重要 因素 之 一 。 


pandas 主要 提供 了 3 种 数据 结构 : Series, 带 标签 的 一 维 数组 ; @DataFrame, 带 标签 


且 大 小 可 变 的 二 维 表格 结构 ; @Panel, 带 标签 且 大 小 可 变 的 三 维 数组 。 


可 以 在 命令 提示 符 环境 使 用 pip 工具 下 载 和 安装 pandas 


然后 按照 Python 社区 的 习 


下 面 的 语句 导入 : 


>>> import pandas as pd 


L 


生成 一 维 数组 


>>> import numpy as np 
>>>x=pd.Series([1, 3, 5, np.nan]) 
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2. 生成 二 维 数组 


>>> dates=pd.date_range (start= '20130101', end= '20131231', freq='D') # 间 隔 为 天 
>>>dates=pd.date_range(start= '20130101', end='20131231', freq= 'M') # 间 隔 为 月 
>>> df=pd.DataFrame (np.random.randn (12,4), index=dates, columns= list ("ABCD')) 
>>> df=pd.DataFrame ([[np.random.randint (1,100) for j in range(4)] for i in range(12)], index 
=dates, colums= list ("ABCD')) #4 列 随机 数 
>>> df=pd.DataFrame({'A': [np.random.randint (1,100) for i in range(4)], 
"B' :pd.date_range(start='20130101', periods=4, freq= 'D'), 
"C':pd.Series([1, 2, 3, 4],index= list (range (4) ) ,dtype= 'float32"'), 
"D':np.array([3] * 4,dtype='int32"), 
"E':pd.Categorical (["test","train","test","train"]), 
"8" :*£00"}) 
>>> df=pd.DataFrame({'A': [np.random.randint (1,100) for i in range(4)], 
"B':pd.date_range (start= '20130101', periods=4, freq='D'), 
'C ': pd. Series ({1, 2, 3, 4], index= [' zhang ', 'li', 'zhou', 
"wang'] ,dtype= 'float32'), 


"D':np.array([3] * 4,dtype= 'int32'), 
"E' :pd.Categorical (["test","train","test","train"]), 
'E':'f£00"'}) 

3. 二 维 数据 查看 

>>>df.head() # 默 认 显示 前 5 行 

>>>df.head(3) # 查 看 前 3 行 

>>>df.tail (2) # 查 看 最 后 2 行 

4. 查看 二 维 数据 的 索引 、 列 名 和 数据 

>>>df.index 


>>>df.columns 
>>>df.values 


5. 查看 数据 的 统计 信息 


>>>df.describe () # 平 均值 .标准 差 ,最 小 值 .最 大 值 等 信息 

6. 二 维 数据 转 置 

>>>df.T 

7. 排序 

>>>df.sort_index(axis=0, ascending=False) # 对 轴 进 行 排序 
>>>df.sort_index (axis=1, ascending=False) 

>>>df.sort_values (by= 'A') # 对 数据 进行 排序 
>>>df.sort values (by= 'A', ascending=False) # 降 序 排列 

8. 数据 选择 

>>>df['A'] # 选 择 列 
>>>df[0:2 # 使 用 切片 选择 多 行 
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>>>df.loc[:, ['A', 'C']] # 选 择 多 列 
>>>df.loc[['zhang', 'zhou'], ['A', 'D', 'E']] # 同 时 指定 多 行 与 多 列 进行 选择 
>>>df.loc['zhang', ['A', 'D', 'E']] 

>>>df.at['zhang', 'A'] # 查 询 指定 行 、 列 位 置 的 数据 值 
>>>df.at['zhang', 'D'] 

>>>df.iloc[3] # 查 询 第 3 行 数据 
>>>df.iloc[0:3, 0:4] # 查 询 前 3 行 . 前 4 列 数据 
>>>df.iloc[[0, 2, 3], [0, 4]] # 查 询 指 定 的 多 行 ,多 列 数 据 
>>>df.iloc[0,1] # 查 询 指定 行 、 列 位 置 的 数据 值 
>>>df.iloc[2,2 

>>> df [df .A> 50] # 按 给 定 条 件 查询 

9. 数据 修改 与 设置 

>>>df.iat[0, 2]=3 # 修改 指定 行 、 列 位 置 的 数据 值 
>>>df.loc[:, 'D']=[np.random.randint (50, 60) for i in range(4)] # 修 改 某 列 的 值 
>>>df['c']=-df['c'] # 对 指定 列 数据 取 反 


10. 缺失 值 处 理 


>>> dfl=df.reindex (index= ['zhang', 'li', 'zhou', 'wang'], colums= list (df.colums) + ['G']) 


>>>dfl.iat (0, 6]=3 
>>>pd.isnull (df1) 


# 修 改 指定 位 置 元 素 值 ,该 列 其 他 元 素 为 缺失 值 NaN 
# 测 试 缺失 值 ,返回 值 为 True/False 阵列 


>>>df1.dropna () # 返 回 不 包含 缺失 值 的 行 
>>>df1['G'].fillna(5, inplace=True) # 使 用 指定 值 填 充 缺 失 值 
11. 数据 操作 

>>>dfl.mean () # 平 均值 ,自动 忽略 缺失 值 
>>>df.mean (1) # 横 向 计算 平均 值 
>>>df1.shift (1) # 数 据 移 位 

>>> d£1['D'].value_counts() # 直 方 图 统计 


>>> df2=pd.DataFrame (np.random.randn (10, 4)) 


>>> pl=d£2[:3] # 数 据 行 拆 分 
>>>p2= df2[3:7] 

>>>p3=df2[7:] 

>>> df3=pd.concat ([pl, p2, p3]) # 数 据 行 合并 


>>>df2 ==df3 


# 测 试 两 个 二 维 数据 是 否 相等 ,返回 True/False 阵列 


>>> df4=pd.DataFrame ({'A' : [np.random.randint (1,5) for i in range(8)]， 
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"B': [np.random.randint (10,15) for i in range (8)], 

'C': Inp.random.randint (20,30) for i in range (8)], 

'D' : Inp.random.randint (80,100) for i in range(8)]}) 
>>> d£4.groupby ('A') .sum() # 数 据 分 组 计算 
>>>df4.groupby (['A 


B']) -mean () 
12. 结合 matplotlib 绘图 


>>> import pandas as pd 


图 科学 计算 与 可 视 化 


>>> import numpy as np 

>>> import matplotlib.pyplot as plt 

>>> df=pd.DataFrame (np.random.randn (1000, 2), columns= ['B', 'C']) .cumsum() 
>>> dé ['A' ]=pd. Series (list (range (len (df) ) ) ) 

>>>plt.figure () 

>>>df.plot (x='A') 

>>>plt.show () 


代码 运行 结果 如 图 17-10 所 示 。 
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图 17-10 绘制 曲线 图 结果 


下 面 的 代码 用 来 绘制 柱状 图 ,结果 如 图 17-11 所 示 。 
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图 17-11 绘制 柱状 图 结果 


>>> df=pd.DataFrame (np.random.rand(10, 4), columns=['a', 'b', 'c', 'd']) 
>>> df .plot (kind= "bar") 


>>>plt.show() 


将 上 面 代码 中 的 绘图 语句 改 为 
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>>>df.plot (kind="barh', stacked=True) 


运行 结果 如 图 17-12 所 示 。 


anov 
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图 17-12 水 平 柱状 图 绘制 结果 


13. 文件 读 写 

>>>d£5.to_excel('d:\test.xlsx', sheet_name= 'dfg') # 将 数据 保存 为 Excel 文件 
>>> d£6=pd.read_excel ('d:\test.xlsx", 'dfg', index_col=None, na_values=['NA']) 
>>> d£6.to_csv('d:\test.csv') # 将 数据 保存 为 csv 文 件 
>>> d£7=pd.read_csv('d:\test.csv') # 读 取 csv 文 件 中 的 数据 


17.5 统计 分 析 模 块 statistics 


(1) 计算 平均 数 函 数 mean()。 


>>> import statistics 


>>> statistics.mean([1, 2, 3, 4, 5, 6, 7, 8, 9]) # 使 用 包含 整数 的 列表 作为 参数 
5.0 

>>> statistics.mean (range (1,10) ) # 使 用 range 对 象 作 为 参数 

5.0 


>>> import fractions 
>>>x= [(3, 7), (1, 21), (5, 3), (1, 3)] 

>>> y= [fractions.Fraction(* item) for item in x] 

>>>Y 

[Fraction(3, 7), Fraction(1, 21), Fraction(5, 3), Fraction(1, 3)] 

>>> statistics .mean (y) # 使 用 包含 分 数 的 列表 作为 参数 
Fraction (13，21) 

>>> import decimal 

>>>x= ('0.5', 10.75", '0.625', 0.375") 

>>> y=map (decimal.Decimal, x) 

>>> statistics .mean (y) 

Decimal ("0.5625") 


(2) 中 位 数 函 数 median) .median_low() ,median_high( .median_grouped() 。 


>>> statistics.median([1, 3, 5, 7]) # 偶 数 个 样本 时 取 中 间 两 个 数 的 平均 数 
4.0 

>>> statistics.median low([1, 3, 5, 7]) ## 偶 数 个 样本 时 取 中 间 两 个 数 的 较 小 者 
3 

>>> statistics.median high([1, 3, 5, 7]) # 偶 数 个 样本 时 取 中 间 两 个 数 的 较 大 者 
5 

>>> statistics.median (range (1,10)) 

5 

>>> statistics.median low([5, 3, 7]), statistics.median high([5, 3, 7]) 

(5, 5) 

>>> statistics.median_grouped([5, 3, 7]) 

5.0 

>>> statistics.median_grouped([52, 52, 53, 54]) 

52.5 

>>> statistics.median_grouped([1, 3, 3, 5, 7]) 

3.25 

>>> statistics.median_grouped([1, 2, 2, 3, 4, 4, 4, 4, 4, 5]) 

3.7 

>>> statistics.median_grouped([1, 2, 2, 3, 4, 4, 4, 4, 4, 5], interval=2) 

3.4 


(3) 返回 最 常见 数据 或 出 现 次 数 最 多 的 数据 (most common data) 的 函数 modeQ 。 
>>> statistics.mode([1, 3, 5, 7]) # 无 法 确定 出 现 次 数 最 多 的 唯一 元 素 


statistics.StatisticsError: no unique mode; found 4 equally common values 
>>> statistics.mode([1, 3, 5, 7, 3]) 

3 

>>> statistics.mode(["red", "blue", "blue", "red", "green", "red", "red"]) 
írod’ 


(4) pstdev() : 返回 总 体 标准 差 (population standard deviation ,the square root of the 


population variance) 。 


>>> statistics.pstdev([1.5，2.5，2.5，2.75，3.25，4.75]) 
0.986893273527251 

>>> statistics .pstdev (range (20) ) 

5.766281297335398 


(5) pvariance() : 返回 总 体 方差 (population variance) Be —%K Hi (second moment) 。 


>>> statistics.pvariance([1.5, 2.5, 2.5, 2.75, 3.25, 4.75]) 
0.9739583333333334 

>>>x=[1, 2, 3, 4, 5, 10, 9, 8, 7, 6] 

>>>mu= statistics .mean (x) 

>>> mu 

5.5 

>>> statistics.pvariance([1, 2, 3, 4, 5, 10, 9, 8, 7, 6], mu) 
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8.25 

>>> statistics .pvariance (range (20) ) 

33.25 

>>> statistics .pvariance ((random.randint (1,10000) for i in range (30))) 
10903549. 933333334 


(6) variance (), stdev ( ) , th 4 FE Æ Wy H% (sample variance) 和 样本 标准 差 (sample 
standard deviation, the square root of the sample variance, 也 叫 均 方 差 ) 。 


>>> statistics.variance (range (20) ) 
35.0 

>>> statistics.stdev (range (20) ) 
5.916079783099616 

>>>_ * 
35.0 
>>> statistics.variance([3, 3, 3, 3, 3, 3]), statistics.stdev([3, 3, 3, 3, 3, 3]) 
(0.0, 0.0) 


本 章 小 结 


(1) 比较 常用 的 科学 计算 可 视 化 模块 有 NumPy、SciPy 和 Matplotlib 。 

(2) NumPy 支持 数组 与 标量 的 运算 数组 与 数组 的 运算 、 向 量 内 积 、 数 组 的 三 角 函 数 运 
算数 组 多 元 素 操作 ,不 同 维 度 的 最 大 值 与 均值 计算 、 切 片 操 作 、 计 算 标准 差 与 方差 以 及 特殊 
数组 生成 等 功能 。 

(3) SciPy 模块 依赖 于 NumPy 模块 ,在 其 基础 上 增加 了 大 量 用 于 数学 计算 、 科 学 计算 以 及 
工程 计算 的 模块 ,包括 线性 代数 、 常 微分 方程 数值 求解 .信号 处 理 .图 像 处 理 和 稀 朴 矩阵 等 。 

(4) Matplotlib 模块 依赖 于 NumPy 和 tkinter 模块 ,可 以 绘制 多 种 形式 的 图 形 ,包括 线 
图 、 直 方 图 、 饼 状 图 和 散 点 图 等 ,是 科学 计算 可 视 化 的 重要 工具 。 

(5) pandas(Python Data Analysis Library) 是 基于 NumPy 的 数据 分 析 模 块 ,提供 了 大 
量 标准 数据 模型 和 高 效 操作 大 型 数据 集 所 需要 的 工具 ,可 以 说 pandas 是 使 得 Python 能 够 
成 为 高 效 且 强大 的 数据 分 析 环 境 的 重要 因素 之 一 。 

(6) Python 标准 库 statistics 提供 了 平均 数 . 中 位 数 , 总 体 标准 差 ,总 体 方差 等 统计 相关 
的 功能 函数 。 


J3 a 
1. 运行 本 章 所 有 代码 并 查看 运行 结果 。 


2. 使 用 Python A ERX dir() 查 看 Scipy 模块 中 的 对 象 与 方法 ,并 使 用 Python YP 
数 help() 查 看 其 使 用 说 明 。 


Bis 密码 学 编程 


信息 加 密 和 信息 隐藏 是 实现 信息 安全 与 保密 的 主要 手段 。 其 中 ,信息 隐藏 或 隐 写 术 具 
有 悠久 的 历史 ,常用 于 版 权 保护 和 信息 保密 等 相关 领域 , 近 几 年 来 与 之 有 关 的 研究 呈 上 升 趋 
势 。 作 为 传统 的 信息 安全 技术 ,加 密 和 解密 算法 则 一 直 都 是 业内 研究 的 重点 。 

Python 标准 库 hashlib 实现 了 SHA1, SHA224, SHA256, SHA384, SHAS12 以 及 
MD5 等 多 个 安全 哈 希 算法 ,标准 库 zlib 提供 了 adler32 和 crc32 算法 的 实现 ,标准 库 hmac 
实现 了 HMAC 算法 。 在 众多 的 Python 扩展 库 中 ,pycrypto 可 以 说 是 密码 学 编程 模块 中 最 
成 功 也 是 最 成 熟 的 , cryptography 也 有 一 定数 量 的 用 户 在 使 用 。 扩 展 库 pycrypto 和 
cryptography 提供 了 SHA 系列 算法 和 RIPEMD160 等 多 个 安全 哈 希 算法 ,以 及 DES, 
AES,RSA,DSA ,ElGamal 等 多 个 加 密 算 法 和 数字 签名 算法 的 实现 。 


18.1 安全 哈 希 算法 


安全 哈 希 算法 也 称 为 报 文摘 要 算法 ,对 任意 长 度 的 消息 可 以 计算 得 到 固定 长 度 的 唯一 
指纹 。 理 论 上 ,即使 是 内 容 非常 相似 的 消息 也 不 会 得 到 相同 的 指纹 。 安 全 哈 希 算法 是 不 可 
逆 的 ,无 法 从 指纹 还 原 得 到 原始 消息 ,属于 单 向 变换 算法 。 安 全 哈 希 算法 常用 于 数字 签名 领 
域 ,很 多 管理 信息 系统 把 用 户 密码 的 哈 希 值 存储 到 数据 库 中 而 不 直接 存储 密码 。 另 外 ,文件 
完整 性 检查 也 经 常用 到 MDS 或 其 他 安全 喻 希 算法 ,请 参见 第 7 章 。 

下 面 的 代码 使 用 Python 标准 库 hashlib 计算 字符 串 的 安全 哈 希 值 。 


>>> import hashlib 


>>> hashlib.md5 ('abcdefg' .encode () ) .hexdigest () # 使 用 MD5 算 法 
>>>hashlib.sha512 ('abcdefg' .encode ()) -hexdigest () # 使 用 SHA512 算 法 
>>> hashlib.sha256 ("abcdefg' .encode ()) -hexdigest () # 使 用 SHa256 算 法 


Python 扩展 库 pycrypto 也 提供 了 MD2、MD4、MD5、HMAC、RIPEMD、SHA、 
SHA224,.SHA256,SHA384,SHA512 等 多 个 安全 哈 希 算法 的 实现 。 


>>> from Crypto.Hash import SHA256 
>>> h= SHA256.SHA256Hash ("abcdefg' .encode () ) 
>>>h.hexdigest () 


18.2 对称 密 钥 密码 算法 DES Al AES 


作为 经 典 的 对 称 密 钥 密 码 算法 ,DES 早 在 1976 年 就 被 美国 政府 采用 ,随后 得 到 美国 国 
家 标准 局 和 美国 国家 标准 协会 的 认可 ,并 成 为 全 球 范围 内 事实 上 的 工业 标准 。DES 算法 使 
用 56 位 密 钥 对 64 位 的 数据 块 加 密 , 并 对 64 位 的 数据 块 进行 16 轮 编码 ,最 终 完 成 变换 。 下 
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面 的 代码 演示 了 Python 扩展 库 pycrypto 中 DES 算法 的 用 法 。 


>>> from Crypto.Cipher import DES 
>>>des_encrypt_decrypt=DES.new('ShanDong', DES.MODE_ECB) 
>>>p= 'Beautiful is better than ugly." 

>>> pp=p.encode () 

# 按 8 字 节 对 齐 

>>>c=des_encrypt_decrypt.encrypt (pp-ljust ( (len (pp) //8+ 1) * 8, '0".encode())) 
>>> cp=des_encrypt _decrypt.decrypt (c) 

>>> cp 

b'Beautiful is better than ugly.00' 

>>> cp[0: len (pp) ] -decode () 

"Beautiful is better than ugly.' 


高 级 加 密 标准 AES Advanced Encryption Standard) 又 称 为 Rijndael 算法 ,是 美国 联邦 


政府 采用 的 一 种 区 块 加密 标 准 , 用 来 蔡 代 DES 算法 ,AES 算法 使 用 代 换 -置换 网 络 ,在 软件 
及 硬件 上 都 能 快速 地 加 解密 。AES 加 密 数 据 块 分 组 长 度 必 须 为 128b, 密 钥 长 度 可 以 是 
128/192/256b 中 的 任意 一 个 (数据 块 及 密 钥 长 度 不 足 时 需要 补 齐 ) 。 
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例 18-1 使 用 Python 扩展 库 pycrypto 提供 的 AES 算法 实现 消息 加 密 和 解密 。 


import string 
import random 
from Crypto.Cipher import AES 


# 生 成 指定 长 度 的 密 钥 
def keyGenerater (length) : 
if length not in (16, 24, 32): 
return None 
x= string.ascii_letters+ string.digits 


return ''.join([random.choice(x) for i in range (length) ]) 


def encryptor_decryptor (key, mode) : 
return AES.new (key, mode, b'0000000000000000") 


# 使 用 指定 密 钥 和 模式 对 给 定 信息 加 密 

def AESencrypt (key, mode, text): 
encryptor=encryptor_decryptor (key, mode) 
return encryptor.encrypt (text) 


# 使 用 指定 密 钥 和 模式 对 给 定 信息 解密 

def AESdecrypt (key, mode, text): 
decryptor=encryptor_decryptor (key, mode) 
return decryptor.decrypt (text) 


if name ==" main 


text= ' 山 东 省 烟台 市 Python 3.5 is excellent.' 
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key= keyGenerater (16) 
# 随 机 选择 as 的 模式 
mode= random. choice ((AES.MODE CBC, AES.MODE CFB, AES.MODE ECB, AES.MODE OFB) ) 
if not key: 
print ("Something is wrong.') 
else: 
print ("key:', key) 
print ("'mode:', mode) 
print ("Before encryption:', text) 
# 明 文 必须 以 字 节 串 形 式 , 且 长 度 为 16 的 倍数 
text_encoded= text .encode () 
text_length= len (text_encoded) 
padding_length= 16- text lengthgs 16 
text_encoded= text_encoded +b'0' * padding length 
text_encrypted=AESencrypt (key, mode, text_encoded) 
print (‘After encryption:', text_encrypted) 
text_decrypted =AESdecrypt (key, mode, text_encrypted) 
print (‘After decryption:', text_decrypted.decode () [:-padding_length]) 


18.3” 非 对 称 密 钥 密 码 算法 RSA 与 数字 签名 算法 DSA 


18.3.1 RSA 


RSA 是 一 种 典型 的 非 对 称 密 钥 密 码 体制 ,从 加 密 密 钥 和 解密 密 钥 中 的 任何 一 个 推导 出 
另 一 个 在 计算 上 是 不 可 行 的 。RSA 的 安全 性 建立 在 “大 数 分 解 和 素性 检测 ”这 一 著名 数论 
难题 的 基础 上 。 公 钥 对 可 以 完全 公开 ,不 需要 保密 ,但 必须 提供 完整 性 检测 机 制 以 保证 不 受 
自 改 ; 私 钥 由 用 户 自己 保存 。 通 信 双 方 无 须 实现 交换 密 钥 就 可 以 进行 保密 通信 。 

RSA 密码 体制 算法 如 下 。 

(1) 由 用 户 选 择 两 个 互 异 并 且 距 离 较 远 的 大 素数 p Mq: 

(2) 计算 n=pXg 和 f/f(m)=(p 一 1) X(g 一 1); 

G) 选择 正 整数 e, 使 其 与 /(n) 的 最 大 公约 数 为 1; 然 后 计算 正 整数 d, 使 得 eXd 对 
(7) 的 余数 为 1, 即 eX d=1 mod f(n) ,最 后 销 筑 p 和 g。 

经 过 以 上 步骤 ,得 出 公 钥 对 (n,e) 和 私 钥 对 (n.d)。 设 M 为 明文 ,C 为 对 应 的 密 文 , 则 加 
密 变 换 为 : C=M* mod n; 解 密 变换 为 : M=C! mod n, 

Python 扩展 模块 rsa 封装 了 RSA 算法 ,可 以 方便 地 使 用 该 算法 生成 密 钥 以 及 加 解密 。 

>>> import rsa 

>>> key= rsa .newkeys (3000) # 随 机 生成 密 钥 

>>>private= key[1] # 查 看 私 钥 分 量 ,输出 结果 略 


>>>print (private.d, private.e, private.n, private.p, private.q) 
例 18-2 ”使 用 rsa 模块 来 实现 消息 加 密 和 解密 。 


import rsa 
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key= rsa.newkeys (3000) # 生 成 随机 密 钥 
privateKey= key[1] # 私 钥 
publicKey=key [0] HAA 


message= ' 中 国 山东 烟台 .Now is better than never." 
print ('Before encrypted: ',message) 


message=message .encode () 


cryptedMessage= rsa.encrypt (message, publicKey) 
print ("After encrypted: \n', cryptedMessage) 


message= rsa.decrypt (cryptedMessage, privateKey) 
message= message .decode () 
print ("After decrypted: ',message) 


Python 扩展 库 pycrypto 也 封装 了 RSA 算法 以 及 DSA 和 ElGamal 算法 ,可 用 于 数字 


签名 和 其 他 相关 领域 。 在 使 用 之 前 ,需要 将 pycrypto 安装 目录 中 的 Crypto/Random/ 
OSRNG/nt. py 文件 中 的 


import winrandom 


一 行 改 为 
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from Crypto.Random.OSRNG import winrandom 
下 面 的 代码 演示 了 如 何 使 用 pycrypto 提供 的 RSA 模块 进行 加 密 和 解密 。 


>>> from Crypto.PublicKey import RSA 

>>> key=RSA.generate (2048) # 生 成 密 钥 ,查看 密 钥 各 分 量 的 值 , 输 出 结果 略 
>>>print (key.key.n, key.key.p, key.key.e, key.key.d) 

>>>p= 'Flat is better than nested. 中 文 测试 ' 

>>> c= key.encrypt (p.encode(), key) 

>>> cp= key.decrypt (c) 


>>> cp.decode () 

"Flat is better than nested. 中 文 测试 ' 

>>> k= key. exportKey ('PEM') # 密 钥 导 出 
>>> keyl=RSA.importKey (k) # 密 钥 导 入 


>>> keyl ==key 

True 

>>> fp=open('D:\Key.pem', 'wb') 

>>> fp.write (key.exportKey ("PEM") ) # 将 密 钥 导 出 到 文件 
1674 

>>> fp.close() 

>>> fp= open ("D: \Key.pem', 'rb') 

>>> key2=RSA. importKey (fp.read () ) # 从 文件 中 导入 密 钥 
>>> fp.close () 

>>> key2 ==key 


True 


18.3.2 DSA 


DSA 是 基于 公 钥 机 制 的 数字 签名 算法 ,其 安全 性 基于 离散 对 数 问题 DLP。 即 给 定 一 个 
循环 群 中 的 元 素 g 和 ,很 难 找到 一 个 整数 zx 使 得 gt 二 hh。 下 面 的 代码 简单 演示 了 
pycrypto 扩展 库 中 DSA 算法 的 用 法 。 


>>> from Crypto.Random import random 

>>> from Crypto.PublicKey import DSA 

>>> from Crypto.Hash import MD5 

>>>message= 'Simple is better than complex.' 

>>> key=DSA.generate (1024) # 生 成 密 钥 
>>>h=MD5.new (message.encode ()) .digest() # 计 算 消息 的 哈 希 值 
>>> k= random.StrongRandom() .randint (1, key.key.q- 1) 

>>> sig=key.sign(h, k) 

>>> key.verify(h, sig) 

True 

>>> h1=MD5.new (message .encode ()+b'3') .digest () 

>>> key .verify (hl, sig) 


False 


AS 章 小 结 


(1) 信息 加 密 和 信息 隐藏 是 目前 实现 信息 安全 和 保密 的 主要 手段 。 

(2) Python 标准 库 hashlib 实现 了 包括 SHA1,SHA224,SHA256,SHA384,SHA512 
以 及 MDS 等 多 个 安全 哈 希 算法 ,标准 库 zlib 提供 了 adler32 和 crc32 的 实现 ,标准 库 hmac 
实现 了 HMAC 算法 。 

(3) 安全 哈 希 算法 也 称 为 报 文摘 要 算法 ,属于 单 向 变换 算法 ,对 任意 长 度 的 消息 可 以 计 
算得 到 固定 长 度 的 唯一 指纹 ,即使 是 非常 相似 的 消息 也 不 会 得 到 相同 的 指纹 。 

(4) 扩展 库 pycrypto 不 仅 提供 了 SHA256 和 RIPEMD160 等 多 个 安全 哈 希 算法 ,还 提 
供 了 DES, AES, RSA ,ElGamal 等 多 个 加 密 算法 的 实现 。 

(5) 安全 哈 希 算法 常用 于 数字 签名 .用户 密码 管理 文件 完整 性 检查 等 领域 。 

(6) Python 扩展 模块 rsa 和 pycrypto 都 提供 了 RSA 算法 的 实现 。 


习 题 
1. 根据 安全 哈 希 值 可 以 还 原 原 始 的 消息 内 容 ( 判 断 题 ,对 或 错 ) 。 


2. RSA 算法 的 安全 性 主要 取决 于 密 钥 的 长 度 (判断 题 , 对 或 错 ) 。 
3. 查看 Python 扩展 库 pycrypto 文件 夹 结构 ,了 解 其 提供 的 各 种 模块 和 库 。 
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第 19 章 ” 安 卓 平台 的 Python 编程 


19.1 QPython 简介 


SL4A 是 Scripting Layer for Android 的 缩写 ,与 Android Scripting Environment 
(ASE) 含 义 相 同 。SL4A 将 脚本 语言 引入 Android 平台 ,允许 用 户 直接 在 Android 设备 上 
编写 和 运行 脚本 程序 ,目前 支持 Python, Perl JavaScript, Tcl 等 多 种 脚本 语言 。 

QPython 扩展 了 SLAA 框架 ,可 以 访问 网 络 、 蓝 牙 .GPS 等 安 卓 特性 ,并 且 支持 Bottle 
和 Django 作为 Web 开发 框架 。QPython 主要 有 两 个 版 本 ,其 中 QPython 支持 Python 2. 7.2, 
而 QPython3 支持 Python 3. 2. 2, 并 且 设 计 更 加 开放 和 灵活 。 在 QPython 中 调用 安 卓 的 
SLAA 接口 ,需要 导入 androidhelper 库 。 

本 章 以 QPython 和 QPython3 为 例 来 介绍 安 卓 平台 的 Python 编程 ,有 些 扩展 包 和 暂时 
还 不 支持 QPython3。 打 开 QPython3 主 界面 , 单 击 "终端 "按钮 进入 交互 式 开 发 模式 ,如 
图 19-1 和 图 19-2。 所 示 


data/data/com. hipipal . qpy3/files/bin/qpyt 


bade irigare data/data/com.hipipal . qpy3/files/bin/qpyt 


.Sh && exit 
/bin/qpython.sh && exit < _— 
bin/qpython. sh && exit < 
yen 3.2.2 (default, Jun 18 2015, 19:03: a a (default, An 18 2018, 19:03 
2) 
4.9 20140827 - 
il GCC 4.9 20140827 (prerelease)] on linux-a 
help", © . 8 © or © 71 
ype "help", “copyright”, "credits" or “li lg ea a oi “ e 
ense” for more information. ype "help", "copyright", “credits” or "li 
>> from random import randint ense" for more information. 
>> [randint(1, 50) for i in range(10)} >> import random 
(28, 26, 18, 41, 29, 4, 16, 43, 17, 35) >> random. choice(range(60)) 
>> map(lambda x: x+5, _) 
map object at 0x4048fa10> >> import math 
>> List(_) >> math.sqrt(9) 
[33, 31, 23, 46, 34, 9, 21, 48, 22, 40) .0 
>T >i 
图 19-1 列表 推导 式 与 内 置 函 数 用 法 图 19-2 基本 表达 式 和 math 模块 用 法 


在 QPython 或 QPython3 主 界面 中 选择 “程序 ”或 “编辑 器 ”, 可 以 创建 和 运行 Python 
程序 ,QPython 和 QPython3 都 是 用 QEdit 作为 Python 程序 编辑 器 ,支持 语法 高 亮 显示 。 
图 19-3 和 图 19-4 演示 了 程序 开发 模式 的 用 法 。QPython 和 QPython3 默认 开发 模式 是 
console, 即 控制 台 应 用 程序 ,如 果 开 发 图 形 用 户 界面 则 需要 在 开头 部 分 加 上 一 行 “# apy: 
kivy”, 如 果 开 发 Web App 则 需要 在 程序 开头 部 分 加 上 “# qpy:webapp: (App 标题 )” 和 
“# qpy: (Web 服务 地 址 :端口 号 )/(Web 服务 路 径 )”。 

在 QPython 和 QPython3 中 可 以 使 用 pip 工具 来 管理 Python 扩展 库 ,pip 支持 的 命令 
主要 有 : bundle, 创 建 包含 多 个 包 的 pybundles; @freeze, 显 示 所 有 已 安装 的 包 ; @help， 
显示 可 用 命令 ; @install, 安 装 包 ; @search ,搜索 PyPi; Ouninstall, Mk; unzip, fE 
缩 单个 包 ; @zip, 压 缩 单个 包 。 
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+ 国 移动 46 回 个 名 帮 


€ QEdit-mainpy 


Pictures demo 


1 
3 

4 

5 | This is a basic picture viewer, using 
HE | 

7 

8 


import ki 
9 | kivy.require('1.0.6") Blank file 
11 | from glob import glob 

12 | from random import randint 

13 | from os.path import join, dirname 

14 | from kivy.app import App 

15 | from kivy.logger import Logger 

16 | from kivy.uix.scatter import Scatter 
17 | from kivy-properties import StringProy 
18 | # FIXME this shouldn't be necessary 
19 | from kivy.core.window import Window 


Script 
WebApp (Project) 


ConsoleApp (Project) 


22 | class Picture(Scatter): 
Picture is the class that will 


picture.kv. Check the rule named 
26 how the Picture() is really const) 


KivyApp (Project) 


28 The source property will be the f: 


source = StringProperty(None) 


<> 2BSPOQFe: 
图 19-3 QPython3 程序 开发 界面 图 19-4 QPython 新 建 项 目 或 文件 界面 


19.2 安 卓 应 用 开发 案例 


例 19-1 在 屏幕 上 显示 字符 串 。 


import android 
d= android.Android() 
d.makeToast ('Hello, Python in Android') 


例 19-2 ”获取 用 户 输入 并 在 屏幕 上 显示 字符 串 。 


import androidhelper 

droid= androidhelper .Android () 
line=droid.dialogGet Input () 
s='Hello %s' %line.result 


droid.makeToast (s) 
例 19-3 扫描 并 显示 条 形 码 。 


import android 
d=android.Android () 

code=d.scanBarcode () 

d.makeToast (code[1] ['extras"] ['SCAN_RESULT" ]) 


例 19-4 打开 手机 摄像 头 并 保存 照片 。 


import sl4a 
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import os 

droid- sl4a.Rndroid() 

# 获 取 已 拍照 片 数量 

t= [x for x in os.listdir ('/sdcard') if x.startswith("pic') and x.endswith('.jpg')] 
n=len(t)+1 

# 打 开 摄 像 头 并 保存 拍 到 的 照片 


droid.cameraInteractiveCapturePicture('/sdcard/pic'+ str (n)+'. jpg") 


例 19-5 获取 GPS 和 罗盘 信息 


import android 
import time 
from math import radians 
droid= android.Android() 
droid.startSensingTimed(1, 250) 
droid.startLocating() 
while 1: 
gpsdata= droid. readLocation () .result 
s€data=droid.sensorsReadOrientation().result 
if len(gpsdata) > 0: 


print (gpsdata['gps'] ["bearing']) # 取 得 Gps 导向 (bearing) (角度 ) 
if len(sédata)>0: 
print (s6data[0]) # 取 得 罗盘 方位 角 (azimuth) (弧度 ) 


time.sleep(0.5) 
droid.stopLocating () 
droid.stopSensing () 


例 19-6 编写 Web App. 


# qpy:3 
# qpy:webapp:Hello Qpython 
# qpy://localhost :8080/hello 
from bottle import route, run 
@ route ('/hello') 
def hello(): 

return "Hello World!" 


run (host= 'localhost', port= 8080) 
例 19-7 使 用 kivy 包 生成 按钮 。 


#- * - coding:utf8;- * - 
#qpy:2 
#qpy:kivy 
from kivy.app import App 
from kivy.lang import Builder 
Jam 
FloatLayout : 
Button: 
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text: "hello world’ 
size hint: None, None 


pos_hint: {'center_x' 


.5, "center y': .5} 
canvas.before: 
PushMatrix 
Rotate: 
angle: 45 
origin: self.center 
canvas.after: 
PopMatrix 
class RotationApp (App) : 
def build (self): 
return Builder.load_string (kv) 
RotationApp () .run () 


例 19-8 使 用 kivy 包 绘 制 可 改变 大 小 和 形状 的 椭圆 。 


#- * -coding:utf8;- * - 
# qpy:2 
# qpy:kivy 
from kivy.app import App 
from kivy.lang import Builder 
kw" 
BoxLayout : 
orientation: 'vertical' 
BoxLayout : 
size_hint_y: None 
height: sp (100) 
BoxLayout : 
orientation: 'vertical' 
Slider: 
id: el 
min: -360 
max: 360 
Label: 
text: 'angle_start={}'.format (el.value) 
BoxLayout : 
orientation: "vertical" 
Slider: 
id: e2 


min: -360 
max: 360 
value: 360 

Label: 


text: 'angle_end={}'.format (e2.value) 
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BoxLayout: 
size hint _y: None 
height: sp (100) 
BoxLayout : 
orientation: "vertical" 
Slider: 
id: wm 
min: 0 
max: 2 
value: 1 
Label: 
text: 'Width mult.={}'.format (wm.value) 
BoxLayout : 
orientation: 'vertical' 
Slider: 
id: hm 
min: 0 
max: 2 
value: 1 
Label: 
text: 'Height mult.={}'.format (hm.value) 
Button: 
text: 'Reset ratios' 
on_press: wm.value=1; hm.value=1 
FloatLayout: 
canvas: 
Color: 
rgb: 1, 1, 1 
Ellipse: 
pos: 100, 100 
size: 200 * wm.value, 201 * hm.value 
source: 'data/logo/kivy- icon- 512.png' 
angle start: el.value 
angle end: e2.value 
m 
class CircleApp (App) : 
def build (self): 
return Builder.load_string (kv) 
CircleApp () .run () 


例 19-9 生成 二 维 码 。 
Python 扩展 库 qrcode 提供 了 生成 二 维 码 的 功能 ,可 以 使 用 pip 工具 安装 ,生成 的 二 维 


码 可 使 用 手机 微 信 扫 描 并 识别 其 中 的 信息 。 


374| 


import qrcode 
qr=qrcode.QRCode (version=10, box_size=10, border=4, 
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error_correction=qrcode.constants.ERROR_CORRECT_L) 

qr.add data ("http://user .qzone.qq.com/306467355/blog/ 1439803492" ) 

qr .make (fit= True) 

img= qr .make_image () 

img. save ("D:\Python_dfg.png") 

最 后 ,如 果 需 要 将 自己 的 Python 程序 以 及 所 有 依赖 包 打包 成 为 APK 文件 以 便 直 接 在 
安 卓 平台 上 和 运行 ,可 以 使 用 Python for Android 或 者 Buildozer, 本 书 不 再 熬 述 。 


AS 章 小 结 


(1) SLAA 将 脚本 语言 引入 Android 平台 ,允许 用 户 编辑 和 执行 脚本 ,直接 在 Android 
设备 上 运行 解释 器 。 

(2) QPython 和 QPython3 扩展 了 SL4A 框架 ,可 以 访问 网 络 .蓝牙 .GPS 等 安 卓 特性 ， 
并 且 支 持 Bottle 和 django 作为 Web 开发 框架 。 

(3) QPython 和 QPython3 默认 的 开发 模式 是 console, 即 控制 台 应 用 程序 ,如 果 开发 图 
形 界 面 则 需要 在 开头 部 分 加 上 一 行 “ 并 qpy:kivy”, 如 果 开 发 Web App 则 需要 在 程序 开头 部 
分 加 上 *#qpy:webapp:(App fl)” M“ # qpy: (Web 服务 地 址 :端口 号 )/(Web 服务 路 
径 )”。 


J Š 


查阅 资料 ,了 解 androidhelper, android, sl4a 这 3 个 包 的 异同 。 
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